徐宏民

徐宏民

記者

國立台灣大學資訊工程學系教授,曾任鴻海集團與Stellantis合資車用科技公司技術長暨副總經理,推動ADAS及智慧座艙系統產品進入全球車用市場。紐約哥倫比亞大學電機博士,專精於機器學習、電腦視覺、自駕車、機器人等領域。為訊連科技研發團隊創始成員,慧景科技(thingnario)共同創辦人,NVIDIA AI Lab計畫主持人;曾任IBM華生研究中心及美國微軟研究院客座研究員。擔任多家科技公司AI策略顧問,習慣從學術與產業雙重視角檢驗技術發展的機會與挑戰。

最新報導
共 49 筆
2026/05/29
2024年下半,我有機會和一家矽谷前瞻大模型公司的高層交流。我問了一個問題:為了減輕伺服器端的推論負載,有沒有可能把部分工作移到終端裝置,甚至開通新的應用情境?對方的回答很直接:根據他們的研究,這完全...
2026/05/26
過去一年多,大型語言模型(LLM)的「推理」已成為主流模型的標準配置。從2024年下半開始,長思考鏈與強化學習訓練逐漸在各主流模型中普及,在程式設計、數學、法律、醫療等資訊密集的領域確實展現效果。這套能力的基礎,在於語言世界本身提供大量訓練素材,而且推理的對錯可以被直接驗證。傳統工業機器人從來不需要推理。它們的設計前提清...
2026/05/20
過去兩年,「世界模型」(WorldModel)成為AI業界引用頻繁、定義卻最分歧的詞彙。每個正在做生成式AI或機器人技術的團隊都會自稱「在做world model」,但仔細看,每家口中的定義並不相同。這個概念本身在認知...
2026/05/12
過去十五年,幾項產業典範先後從0到1跨越商用門檻。手機從2007年iPhone重新定義形態,5年後(2012)出貨進入交叉點;ADAS從2014年深度學習推動視覺辨識成熟、Tesla Autopilot量產起算,到2022~2024年中國市場進入L2+標配狀態,跨越約十年;大型語言模型從2020年GPT-...
2026/05/06
上一篇談到機器人訓練資料的4種來源:遙控示範、模擬器、影片、穿戴設備。其中模擬器看似最方便——資料生成邊際成本接近零、場景參數(天候、情境等)可以隨意調整。從MuJoCo、IsaacSim到...
2026/04/28
服務型與移動型機器人在商業場域的部署密度,過去3年明顯加速,巡檢、倉儲、餐飲、商場、醫院物流、戶外遞送逐一導入;這些機器人驅動核心仍以預先定義的規則與固定流程為主。緊接而來的技術主軸,是 VLA(Vision-Language-Action)架構:以 LLM/VLM ...
2026/04/24
太平洋兩岸的機器人新創與頂尖實驗室,這一年來在一件事上達成共識:模型架構不再是唯一焦點,資料成為競爭的核心資源。不論技術路線如何演變,多數團隊最終都會遇到同一個瓶頸——機器人行動「訓練...
2026/04/15
煎蛋翻面不到2秒,但每一步都是連續的感測判斷與力道決策;塗果醬、擺餐盤同樣如此。這類「低階技能」(atomic skill)的難點不在於執行固定軌跡,而在於複雜環境正確執行。前一篇討論的VLA架構解決的是(高階...
2026/04/14
大型語言模型(LLM)問答能力超強,讓人自然產生一個直覺:把LLM接上機器人,使用語言下指令,機器人是不是就有智慧行動力?直覺沒錯,但中間有幾個結構性的缺口,填補這些缺口的解法,就是目前崛起的機器人AI新引擎:VLA(Vision-Language-...
2026/04/09
大型語言模型在近年展現出3個令人驚訝的能力:泛化(generalization),在從未見過的問題上給出合理答案;多任務(multitasking),同一個模型寫程式、翻譯、分析財報、判讀法律文件;推理(reasoning),把複雜問題拆解成步驟,逐一推導出解答。正是這三個能力,讓大型語言模型在數位世界掀起典範轉移。下一個問題,是...
智慧應用 影音