椽經閣 - 徐宏民專欄

徐宏民

國立台灣大學資訊工程學系教授

國立台灣大學資訊工程學系教授，曾任鴻海集團與Stellantis合資車用科技公司技術長暨副總經理，推動ADAS及智慧座艙系統產品進入全球車用市場。紐約哥倫比亞大學電機博士，專精於機器學習、電腦視覺、自駕車、機器人等領域。為訊連科技研發團隊創始成員，慧景科技（thingnario）共同創辦人，NVIDIA AI Lab計畫主持人；曾任IBM華生研究中心及美國微軟研究院客座研究員。擔任多家科技公司AI策略顧問，習慣從學術與產業雙重視角檢驗技術發展的機會與挑戰。

Digital AI vs. Physical AI：同一套成長邏輯，兩條路徑

2026年5月東京人形機器人高峰會上，一家國際顧問公司的合夥人展示一張實體AI（Physical AI）的全球勞動自動化市場潛力圖。回來後，我把同一家機構的智庫報告中關於數位AI（Digital AI）的職能分類，重劃成一張對應圖。2張圖最有意思的地方，不是整體潛在市場（TAM）規模相近，而是說的是同一件事：自動化總是先從「結構化」場域開始。過去2年，AI帶動的運算與供應鏈經濟規模快速成長，動力主要來自Digital AI：推論模型的token消耗、推論經濟的成形，加上AI代理（AI Agent）的興起。那麼，Digital AI的演進時程，也會是Physical AI的路徑嗎？先看第一張圖。Digital AI的市場版圖，核心原則清楚：任務愈規則化、資料愈密集，自動化愈快發生。以職能分類，差距顯著：財務、法律、行政領域有55%至65%的工作屬於高度可自動化範疇；軟體、研發、STEM領域約40%至50%；醫療、教育、管理領域則只有15%至25%。合約審閱、財務對帳、法遵查核，有明確的輸入輸出與可學習的歷史資料，數位代理人活在「已被結構化」的資訊環境裡。反觀主治醫師的臨床決策或管理者的組織判斷，牽涉情緒脈絡與權責，超出當前代理人的處理能力。Digital AI的邊界，是「非結構化判斷」的邊界。Physical AI的市場版圖，則以地理維度切分：以製造業高度密集的南韓、德國為代表，實體勞動中有65%至75%屬於高度結構化任務，涵蓋工廠產線、倉儲物流、重複性組裝；日本、中國、美國等混合型經濟體，這個比例約為40%至55%；以印度為代表、服務業與非正式勞動佔比偏高的經濟體，則只有10%至20%。這個地理切分，邏輯與Digital AI相同，只是「環境」從資訊空間換成實體空間：工廠的產線是被高度設計過的實體環境——固定的作業台、可預期的物件、重複的動作序列——對機器人來說是相對友善的場域。零售服務、建築工地、居家照護，面對動態、不可預測的實體情境，機器人的自主能力仍非常有限。2個版圖的邊界因此高度對稱：一邊是「非結構化判斷」，一邊是「非結構化實體環境」。換句話說：Digital AI把資訊世界結構化、智慧化，Physical AI再把實體世界結構化、行動化。2條路徑的不同，先出現在時程上。Digital AI已進入擴散期：本專欄〈推論經濟學〉與〈Token帳單之後〉追蹤過這個變化，推論成本已從每百萬token 30美元跌至1美元以下，但帳單不減反增，總用量的成長速度遠超單價下滑。市場研究機構預測，2026年底約40%的企業應用將整合任務型AI代理，從2025年不到5%的基礎一年內大幅跳升，是臨界點後的快速擴散。Physical AI這一邊，需求走在技術前面：製造與物流現場的缺工是剛性需求，4兆美元的潛在市場逐漸成形，但機器人在現場能穩定做到的仍然有限。2026年5月東京的人形機器人高峰會與6月維也納的ICRA，反覆出現的觀察是：當前被稱為「成功」的機器人部署案例，幾乎都是透過縮窄問題範疇來達成自主性，而不是真正解決泛化能力的問題。觸覺、Sim-to-Real、長時序規劃與世界模型的差距，本系列前幾篇已分別說明。這個需求與能力的落差，不代表方向錯了，而是時程不同：Digital AI的問題是「該在哪裡找到成長曲線」；Physical AI的問題是「該在哪裡確認成功案例」。這條時間差，有一條能力曲線可以量化比較。模型評估機構METR（Model Evaluation & Threat Research）的Time Horizon追蹤計畫，以「人類完成同一任務所需時間」衡量各世代模型能以50%成功率自主完成的任務複雜度。從2019年GPT-2只能處理約1至2秒的簡單任務，到2026年的新一代模型，可完成的軟體類任務時長已達16小時等級，依其估算約每7個月翻倍。以8小時（一個標準工作天）為參考線，近期模型已陸續越過，意味著數位代理人有機會從「加速執行」走向「獨立接手整天的工作」。這條指數曲線，目前只存在於數位世界：機器人要在實體環境中跨越數小時穩定完成複雜任務，所需的規劃深度、容錯能力與環境適應性，還需研究突破。Physical AI的慢，不只在模型能力，也在部署方式。數位代理人的導入本質上是軟體問題：API串接、資料清理、流程重新設計，從決策到運行快則幾週；失敗可以修正，持續迭代。Physical AI的導入是系統整合問題：場地改造、安全認證、與既有設備的整合，時程以年計，成本以千萬計。但是高門檻反而創造黏性：一家工廠花兩年把機器人整合進產線，不會因為競爭對手推出更好的軟體就輕易替換。兩者的差距，也體現在「驗證」這個環節。數位代理人的迭代迴路是：推理、工具呼叫、執行、檢查結果、修正，整個循環在數位空間完成，失敗成本低，可即時重試，能力就在快速循環裡累積。Physical AI的迴路根本不同：機器人難以在真實場域反覆試錯，一次碰撞或抓取失誤的代價，可能是設備損壞或人員風險，驗證必須在執行之前完成，而非之後。這也是大家對世界模型在Physical AI中的期待：機器人需要先在模擬中「預演」動作結果，確認可行後才進入實體執行。在數位空間，驗證迴路天然存在；在實體空間，可能得靠世界模型解決，但是還沒收斂。因此，Physical AI的市場進入邏輯更接近「先深後廣」：先在結構化程度高的場域建立灘頭堡，累積具身資料與安全認證紀錄，再逐步向更複雜的場域擴張。具身資料難以從網路大量取得，主要來自真實部署；而獲得真實部署機會，又需要先通過安全認證與場域驗證。這個循環，讓先進入特定場域的廠商建立起難以複製的護城河，即使後進者的軟體技術更先進。Digital AI與Physical AI 2個市場都在快速成長，合計每年潛在經濟價值達數兆美元等級，涵蓋的是人類2種核心的勞動形態。Digital AI開始進入收成期，競爭格局正在集中；Physical AI仍在播種期，先行優勢可能要再過幾年才會清晰顯現。2條路徑，同一套成長邏輯：AI總是先在結構化世界立足，再從那裡逼近非結構化世界。

2026-07-14

Physical AI：從產業競爭走向國家競爭

2026年5月底東京Humanoids Summit，原本以技術與商業化為主軸的峰會，今年也為政府代表與政策觀察者保留講台。一家美系機器人大廠的政策副總裁在會中直言：「政府不介入已經不行了。」理由包括：AI政策與機器人政策開始交疊、自主系統的軍民兩用性質讓機器人進入國安視野。技術一旦被劃入國安範疇，政策資源往往隨之增加，無人機與5G都走過這條路，接下來可能輪到機器人。這不只是一位企業高階主管的觀察。截至2026年，已有十餘個國家或地區提出具官方背書的機器人或智慧機器國家發展架構，從日本、南韓、新加坡、印度，到德國、法國、荷蘭、中國與澳洲。架構的核心要素已逐漸成形：從人才訓練、研究資金、安全標準，到供應鏈韌性、國安與貿易政策；後三項關聯地緣政治。這些路徑大致可以收斂成4種模式：1. 美國是產業先行、政府補位的產業主導型；2. 中國是全政府動員、由上而下推進的國家動員型；3. 歐盟是以法規架構定義可信任生態系的法規治理型；4. 日本與南韓則同屬政府與產業緊密配合的協同生態型，但做法不同：日本靠政府主導的共用資料平台，南韓靠政策延續與大企業投資。美國的邏輯一貫：產業夠強，政府通常不急於介入。從晶片運算、電動車跨足機器人的科技大廠，到人形機器人新創與頂尖AI研究實驗室，實體AI（Physical AI）生態系的資本、模型與平台能量仍高度集中在美國。美國國會2025年起開始相關討論，目前推進較快的是對中國機器人的限制措施；聯邦層級、以機器人產業為核心的國家機器人戰略，尚未成形。日本曾長期位居全球工業機器人密度第一，但依IFR修正後的計算基準，2025年已滑落到第四，類似的反思在東京峰會多次出現：硬體優勢不再夠用，政策重心轉向資料與基礎模型的競爭。日本經濟產業省（METI）近年整合高效能運算（HPC）基礎設施與新設的具身智慧（embodied AI）旗艦計畫，讓企業共用機器人資料與模型；2026年3月發布的新版AI機器人戰略，目標2040年在全球AI機器人市場取得30%以上市佔率，期望重新站回與中美並列的位置。南韓是最早把機器人提升到國家法律層級的國家：2008年的智慧型機器人開發與普及促進法奠定基礎，十餘年政策延續性累積出生態系厚度。2026年六月底，南韓進一步把Physical AI與半導體、AI資料中心並列為三大國家旗艦計畫，由總統府直接督導，目標2028年讓10個產業別的人形機器人進入商用，並開發自主的機器人基礎模型。南韓模式裡，資本仍來自民間，但政府的主導性明顯增強。中國的機器人政策以2015年「中國製造2025」為分水嶺，機器人列入十大重點產業；2026年的第十五個五年規劃首次把具身智慧與量子技術、腦機介面、6G並列為頂層新興產業方向。同年2月，工信部轄下的標準化委員會發布人形機器人與具身智慧標準體系，並明列國際標準化目標：先立標準、再定市場門檻，過去用在5G，如今延伸到機器人。地方政府競相設基金、建園區，形成外界稱「全政府推進」的格局，但商業化仍待驗證：出貨多流向研究、教育與展示市場，製造現場仍以試點居多；規劃文件強調供應鏈自主化，反映精密減速器等核心零組件仍仰賴日德業者。歐盟AI Act於2024年8月生效，但2026年6月定案的簡化方案，把機器人安全元件等高風險應用的合規時程延後到2028年。2025年公布的AI Continent Action Plan擴建歐洲AI運算基礎設施；同年推出的Apply AI策略把機器人列為戰略產業之一。德國、法國、荷蘭各自執行國家機器人戰略，中央法規加成員國執行的雙層架構，即使時程放緩，寄望的仍是「布魯塞爾效應」：當AI法規成為進入全球市場的門檻，歐盟的監管架構就有機會成為實質的全球標準。真正的競爭在標準，不在速度。4種模式之上，還有一張全球分工圖，東京會場的版本是：矽谷負責模型與資本，日本負責精密製造，南韓負責量產可靠性，中國負責硬體速度。台灣近期推出「智慧機器人產業推動方案」，規劃4年投入百億元、設立國家智慧機器人研究中心，以服務型機器人切入醫療照護與餐飲等缺工場域，也在試著標出自己在這張分工圖上的位置。訓練資料的問題，在機器人領域格外值得關注：相較於大型語言模型，機器人可用的訓練資料少了2到3個數量級；彌補這個差距的方式之一，是讓機器人在真實作業環境中「持續學習」，邊部署邊累積場域資料、持續更新模型。台灣的製造與服務場域，恰好提供這個機制所需的條件。Physical AI最終競爭的，未必只是誰能造出最多機器人，而是誰能建立讓機器人持續、安全、可驗證地進入真實場域的產業條件。

2026-07-10

AI也會歧視AI嗎？

隨著招募流程的兩端逐步由AI代勞，一份履歷能不能進入入圍名單，可能取決於一個求職者完全不知道的因素：履歷協作的模型，跟篩選履歷的模型，是否為同一家。2025年底收錄於人工智慧倫理與社會研討會（AIES 2025）的一份研究，就這件事進行系統性的實驗。研究在控制履歷品質之後，比較模型生成與人工撰寫的履歷在不同模型中的評價：當撰寫與評審（模型）來自同一家，求職者進入面試入圍名單的機率高出2成到6成；在多數測試案例中，同等品質的履歷，模型對 AI 生成內容的評分高於人工撰寫版本。研究稱這個現象為「自我偏好（self-preference bias）」：語言模型會偏愛自己生成的內容，即使品質已被刻意控制。這份研究的實驗場景，如今已貼近現實。HireVue 2026調查顯示，逾7成HR團隊已定期在招募流程中使用AI，近7成求職者也已用AI起草履歷。一邊用AI審、一邊用AI寫，已是現況而非未來情境。對堅持自己撰寫履歷的求職者，這意味著可能在不知情的情況下，僅因履歷未經模型加工，就在評分上落後。這個現象，2026年6月有了更具體的面貌。AI工具比較業者i10X Research發布1份產業測試報告，讓幾個主流模型互評同一位虛擬求職者的履歷，只換成由各家模型分別撰寫的版本，再交給各模型逐一評分。這份報告來自產品行銷背景的業者，非學術同行評審，但凸顯相當現況。i10X Research的商業測試顯示，各家模型的偏好傾向差異相當大：Claude對GPT撰寫版本的錄取率，比對自身風格版本低了約5成；GPT對自身版本的評分反而偏低，呈現反向的自我懲罰；Gemini撰寫的版本不分評審者都受到青睞。在i10X的測試設定中，同一份文件由不同模型評審，差距可以大到足以讓結果從「待定」滑向「淘汰」。這延伸原始研究對「模型風格會影響模型評分」的觀察：不是每個模型都偏愛自己，而是每個模型都有自己的評分傾向，求職者完全無從得知評審偏好那套模型。AI評審的脆弱性，學術審稿已先凸顯。2025年中起，多篇arXiv稿件被發現在PDF裡藏進肉眼看不見的指令，要求語言模型審稿人給予正面評價，實驗顯示這類手法可以把模型評分推近滿分。頂尖會議ICML 2026 把相同做法反過來用在稽核：在論文PDF嵌入隨機詞彙，若審稿人偷用語言模型代寫意見，詞彙就會混進評語；2026年3月公布的結果，逾500位審稿人被偵測到違規，其中不少人因身兼投稿審稿人，所投論文遭退件。這套攻守兼備的機制對B2B場景的啟示在於：指令注入手法既是攻擊面，也能作為稽核工具的設計基礎。履歷只是起點，影響不會停在這裡。當企業流程的兩端都開始由AI代理人處理，一端用AI起草報價、技術方案、法遵文件，另一端用AI篩選與評分，「用哪一家模型」會成為過去不存在的競爭變數——過去企業競爭的是價格、品質、交期；未來還可能競爭「模型相容性」。機制尚未完全釐清，但有幾種可能的解釋。語言模型在生成內容時，似乎帶有可被自家模型識別的「風格指紋」——句構偏好、用詞分布、段落節奏。一個可能的解釋來自後訓練（post-training）階段：RLHF、DPO等對齊訓練以相同的訓練目標，同時塑造「怎麼寫得好」與「什麼算寫得好」，風格與好惡因此一起被寫進模型權重，評審模型可能因此將這些熟悉的風格特徵誤判為較高的內容品質。研究也驗證，透過提示工程要求模型主動識別並校正自身偏好，偏差可下降5成以上；但這並非預設行為，企業內部的AI評估流程多半還沒有寫進作業規範。把場景移到台灣產業，有可能受影響的是自動化報價與RFQ初篩。試想：買方以AI從上百份供應商技術文件中挑出前段名單，供應商也以AI起草標案。若這套篩選以文本摘要或技術敘述做初步排序，而買賣雙方使用的是不同家的模型，供應商可能在價格、交期等結構化條件被充分比較之前，就因文本風格不符模型偏好而落後。這個情境目前仍是推斷，但隨著AI在採購流程的應用逐步深化，陸續發生的可能性不低。供應商盡職調查與法遵審查也在其中——ESG報告、資安自評書，愈來愈多由AI起草、也可能再由AI審查，同源偏差的空間同樣存在。需要說明的是，研究測量的偏差幅度建立在文本敘述上，B2B 採購裡的價格、交期、認證等結構化欄位仍佔相當權重，整體入選率不會直接受到相同幅度的影響。但只要評估流程裡有任何一段是模型對模型讀「敘述」，這一段就有結構性偏差。防禦方向可能不複雜，但需要刻意設計。受評文件與評審模型最好不來自同一個模型家族；高金額或高敏感度的決策，應採多模型並行評估、考量評分差異；結構化資料與文字敘述分流計分，避免後者拉偏前者；可能暗藏內容的格式（如 PDF、Word）進入評估流程前，應做指令注入過濾；重要閘門保留人工抽查。這些不是技術突破，而是治理設計，目前產業界的 AI 導入多半停在工具層，治理層大多仍是空白。同源偏差以外，還有另一層問題值得思考：當評估流程由人換成模型，人類評審辨識「少數亮點」的能力，可能也悄悄消失了。一百份履歷裡長得不一樣的那個人，一百份提案裡帶著真實觀點的那份文件，在傾向偏好熟悉風格的模型眼中，可能反而是扣分項。HR篩選、績效評估、供應商評鑑、學術審稿，都面臨類似的結構。如何在AI介入的決策流程裡，刻意保留人類洞察的空間，目前仍是個開放的問題。

2026-07-01

Physical AI產業化的安全缺口

前兩個世代的機器人發展，安全框架的設計前提都是「確定性」。第一代被鎖在柵欄裡執行固定動作；第二代走出柵欄，但沿著預先規劃的路線移動。不論哪一代，系統在特定輸入下會做什麼，工程師都能事先預測，安全標準也是在這個前提下建立的。第三波機器人的期待是「自主性」，能在非結構化環境中做判斷、應對未曾見過的情境。但自主性本質上隱含「不確定性」，而這正是現行機器人安全框架從未真正處理過的問題。這個矛盾在近期的產業與學術會議上，被業界與研究機構眾人獨立點出，並從不同角度收斂到3個層次的問題。第一個問題：停機不等於安全。最具體的觀察，來自一家德系安全運動控制廠商。傳統工業機器人的安全設計，預設「靜止等於安全」的前提，這個前提撐起 ISO 10218 近二十年。問題是，雙足機器人停下來之後，危險並沒有消失。一台高一百七十公分、重七十公斤的機器人，靜止狀態的重心控制比傳統機器人複雜許多，更重要的是它可能倒下。該廠商的工程師指出，現行安全停止計算框架尚未涵蓋雙足機器人的倒落風險；若要補入倒落半徑這個變數，整條公式需展開為7個變數的加總，涵蓋倒落區域、人機趨近距離、制停距離、感測器偵測範圍，以及位置與狀態的不確定性。一家歐系車用MCU大廠在ICRA 2026的產業場次，從半導體驅動IC角度獨立量化「安全停機（STO）」的5個根本侷限：無法控制減速中的肢體運動、無法抵抗重力導致的倒落、無法跨關節協調出安全姿態、無法在故障時提供力矩回饋、無法處理局部失效的連鎖反應。同一場次，一家德系協作機器人廠商明確表示功能安全認證已是部署前提而非事後程序。3個產業背景，同一個結論：停止，不是安全狀態的終點，而是另一種危險的起點。延伸報導專家講堂：ICRA 2026觀察：如果機器人開始刮你鬍子了第二個問題：測試基準的缺席。德國Fraunhofer IPA，歐洲大型應用研究機構之一，購入一台市售機器人，用自行建立的66項評估框架跑完第三方測試。結果顯示：手臂在中等負載下不到2分鐘就過熱關機；碰撞力測試結果超過500牛頓（N），明顯超出ISO/TS 15066對多數接觸場景的規範範圍；藍牙連線存在安全漏洞；機器人持續將資料傳回廠商伺服器，且未見於任何說明文件；電池續航不到2小時。這些問題有賴第三方主動測試才得以浮現；現行規範並未要求廠商揭露。展場上看到的，都是精心設計的成功展示。第三個問題，也是最難處理的一層：VLA讓安全評估框架的根本假設失效。傳統安全框架依賴「風險可被量化」的假設，識別危害類型，估算發生機率、暴露頻率與傷害程度四者相乘，得出危害評分。ADAS產業對這個框架的侷限早有認識——感知模型即使按設計運行，仍可能在特定情境下輸出危險決策，SOTIF（ISO/PAS 21448）正是為此而設計，專門處理「預期功能本身的不足」。但即使如此，ADAS 的操作場域相對受限。延伸報導專家講堂：VLA（Vision-Language-Action）機器人的新智慧引擎SOTIF的長尾問題至今仍未完全解決；VLA機器人的操作環境遠比道路開放，連SOTIF也難以直接套用。因應這個困境，目前出現2條技術路徑：建立不信任主控制器的獨立安全監督層，以及在每個關節配置具備功能安全認證的MCU，讓安全判斷發生在關節層級。兩條路徑底層邏輯一致——用確定性系統監督非確定性系統——但都尚無正式認證，各自在等標準追上來。這不只是工程問題，也是法律問題。前美國消費者產品安全委員會主席Elliot Kaye在Humanoids Summit提出的問題很具體：當機器人在工廠傷害工人，責任在製造商、操作者，還是AI模型開發者？自駕車產業已提前示範安全事故如何反向改變監管態度。2023年Cruise自駕車在舊金山發生牽涉行人的交通意外，整個部門被迫停止運作，一次事故讓整個產業的發展付出代價。機器人在工廠傷人，法律環境只會更複雜。Kaye指出：贏得部署競賽的，不是最好的展示，而是最快通過買方法務審查的那一家。誰在定義標準，誰就在定義市場的進入條件。工業機器人時代已有前例：ISO 10218的主要起草機構，都是在這個市場有長期積累與部署數據的業者，後進者即便技術趕上，標準解釋權仍有落差。機器人功能安全的對應標準目前尚未成形，但很可能在2028到2030年之間建立起來。今天各方關注的是誰能做出最好的機器人；幾年後市場真正競爭的，可能是誰能最快證明它足夠安全。

2026-06-23