NVIDIA GTC 2018觀察（二）：深度學習市場的期待

徐宏民
2018-04-25
分享
Line

深度學習技術已有極大突破，但是落地為產品還是有諸多挑戰。預料接下來的重心將會轉移到誰的產品技術策略正確、客戶願意買單。NVIDIA Corporation

接續在GTC 2018的觀察。這個在矽谷聖荷西舉辦，近年來人工智慧（深度學習）技術最火熱的產業會議，今年人數爆增到8,500人。

和去年相比，市場的期望是什麼？我的觀察：前幾年大家想瞭解什麼是深度學習技術、可以做什麼？今年明顯感受到，大家在乎的是如何將技術落地為產品。

深度學習技術有極大的突破，但是落地為產品還是有諸多挑戰。比如，如何設計符合需求的網路？具有關鍵角色的訓練資料在哪裡？目前的網路模型過大（數百萬個參數）、耗費記憶體、運算資源，如何提升訓練跟推理時的效率？終端環境的硬體設計呢？跟既有的軟體工程系統如何銜接？

比如說，訓練資料是大家產品開發上第一個遇到的問題。在這次會場上我們發表了50分鐘的技術演說，分析如何有效率的採集關鍵性的深度（機器）學習訓練資料以及訓練方式，在現場也滿滿感受到這股強烈的需求。

我們整理了四種策略：首先由社群媒體上的公開影像、視訊、對話等下載所需的資料，再透過群眾外包完成標註。其次是利用弱監督(weakly supervised)或是半監督(semi-supervised)的算法，利用少量的標註資料（或是包含其它未標註的大量資料）進行學習訓練，以降低昂貴費時的資料標註。再來是使用不同（接近線性）的轉換方式，產生更多（但是近似）的資料。最後，也是目前看來最有機會的，善用3D圖像生成，或是生成對抗網路（GAN）來生成跟多互補性的訓練資料。

NVIDIA也呼應這個訓練資料、訓練環境的主軸，分別推出針對自駕車以及機器人訓練的圖形模擬平台。當然對於客戶急需部署深度學習推論功能在大型數據中心，也將技術擴及到Kubernetes開源系統；在終端環境加速推理效率的TensorRT。

我料想，接下來在深度學習的技術浪潮中，重心會從炫目的展示，轉換到誰的產品技術策略正確、誰的解決方案願意讓客戶買單才是！

徐宏民
台大資工系教授

徐宏民(Winston Hsu)現任富智捷(MobileDrive)技術長暨副總經理以及台大資訊工程學系教授。哥倫比亞大學電機博士，專精於機器學習、大規模影像視訊搜尋與辨識。為訊連科技研發團隊創始成員，慧景科技(thingnario)共同創辦人，NVIDIA AI Lab計畫主持人；曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會；十餘年產學合作及新創經驗。曾獲2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018偽裝人臉辨識冠軍、傑出資訊人才獎、吳大猷先生紀念獎等國內外研究獎項。