DIGITIMES - 椽經閣

笛卡爾與人工智慧

17世紀的法國思想家勒內·笛卡爾（René Descartes），不僅以「我思故我在」為現代哲學奠基，也以《幾何學》（La Géométrie, 1637）開創解析幾何，首次將幾何圖形與代數方程結合，發明今日熟知的笛卡爾座標系。此一突破不僅改變數學問題解法，更為微積分與現代人工智慧（AI）提供核心基礎。笛卡爾認為，平面上的每一點皆可用x與y座標表示，而曲線則可轉化為變數方程式。這使得幾何問題能用代數操作處理，例如圓的方程式 x2+y2=r2x^2 + y^2 = r^2x2+y2=r2。這種將抽象空間數學化的思維，與現今AI模型的建構如出一轍。在AI領域，所有輸入的影像、語音、文字資料都需轉為向量座標表示。影像為像素的RGB值集合，語音轉為頻譜，文字則嵌入高維語意空間。這些數據處理方法，正延續解析幾何「將現實投射於數學空間」的思維。神經網路與支持向量機等模型，會在多維空間中尋找最佳超平面來分類資料。深度學習訓練仰賴梯度下降法，透過多維導數找出使誤差函數最小化的方向，步步逼近最優解。此過程需用鏈式法則計算各層參數對結果的影響，亦即微積分中的複合函數求導。而這些演算法運作的數學場域，正建立於笛卡爾所創的座標系之上。進一步來說，像Word2Vec或BERT這類自然語言處理技術，將詞彙轉化為稠密向量，使語意相近的字詞在向量空間中相互靠近，這種「語意即距離」的嵌入技術，也可視為解析幾何的延伸。電腦視覺中的卷積神經網路（CNN），透過多層特徵提取，從像素空間轉換到形狀與語義空間，展現出「座標轉換以理解現實」的深層結構。從AlphaGo到GPT-4，AI系統不斷在函數空間中尋找最佳解。這些空間的數學結構源自笛卡爾當年奠定的幾何與代數統一。笛卡爾的哲學關注「心靈」與「機器」的界線，他認為動物如機械般運作，而人有思考的靈魂。今日AI雖能模擬語言與視覺，但是否真正「理解」仍是哲學難題。從數學化思維到理性工具，笛卡爾提供一把通往AI時代的鑰匙，卻也提醒我們，智慧不只是算法，更是對思維本質的深刻省思。

台灣優勢產業的誕生

台灣目前有3個產業在全球的表現相對耀眼，分別是醫療體系、電子製造服務和半導體。競爭力的來源雖然在不同產業可能各自相異，但是都有一個共通的來源，而且可能是最重要的因素：長期社會菁英的持續投入產業，而這時間尺度是以甲子為單位來計。台灣的醫療體系在世界的評比長年高居第一，毋庸贅述。台灣的現代西方醫學訓練始於日本殖民政府於1899年設立的台灣總督府醫學校（Medical School of the Taiwan Governor-General，即台大醫學院的前身）。1904或1905年間台籍人士南志信入學，1909年畢業，成為台灣本土人士接受近代西方醫學訓練的第一人，從此引領台灣菁英從醫的序列。台籍人士於日據時代不容學習政、法專業，而台灣醫生的收入及社會地位長期居於高位，是以持續吸引社會菁英投入，至今仍是大學招生第三類組的首選。醫療體系的管理人員也是從此團體中挑選，這解釋了為何台灣醫療系統能長期脫穎而出。值得一提的是醫療原來是服務業，有強烈的地緣關係。而且醫療、保險等各國都有各自的法律規範，不易將之產品化輸出。但是從人工智慧逐漸加入醫療體系以後，這類服務性產品的地緣壁壘逐漸消失，可以合理預期台灣的醫療服務將有擴大版圖的可能。從20世紀初迄今，這是兩個甲子社會菁英的持續投入。電子製造服務業與半導體產業是另一個故事。1966年台灣政府鑑於長期巨額貿易逆差的考量，建立出口加工區（Export Processing Zone；EPZ），以賺取外匯、降低逆差。「巨額」的貿易逆差是多少金額呢？不到1億美元，但這是當年台灣GDP的2.5%！出口加工區的設立以及其他產業的集體努力使得台灣於1971年轉變為貿易順差，並且長期維持順差。當時加工出口區中主要產品為黑白電視，首先入駐的外資企業為RCA （Radio Corporation of America），之後還有增你智（Zenith）等。這些外資企業的先後進駐使得台灣黑白電視出口產量佔世界一半以上。雖然此時彩色電視已經問世，黑白電視算不上高階消費性產品，而且在台灣的加值也只是簡單的組裝，但是外商大規模的進駐形成台灣電子業的基底。後來RCA移轉黑白電視技術更進一步深化台灣技術能力。這些貢獻至少不亞於「造山者」中描繪的RCA移轉半導體技術給台灣。電子業的先發成為後來半導體產業發展的沃土。現在看來，此舉奠定台灣電子製造服務的基礎，也驅動電子製造的供應鏈，譬如鴻海在1973年成立時便是以電視旋鈕（knob）供應商的角色切入電子製造服務產業。也許是巧合，但更可能是薪資的市場機制，當1971年台灣貿易開始轉為順差時，電機系也同時成為大學第二類組的首選，台灣的菁英人才開始流向電子業，最後乃至於半導體產業，迄今也近一甲子。有趣的是台灣特殊的大學入學制度促使特定產業的人才供應特別充裕，間接的也讓台灣的產業發展集中於特殊的領域。對於台灣這樣人口基底相對有限、內需市場狹小的國家，專注與集中恰恰好是應有的發展策略。這段歷史可以讓目前竭力想發展自有半導體的國家借鑒參照，更可以讓想以其他方式掠奪產業的國家省思。

先進封裝的標準制定

先進封裝雖然在高階手機領域應用中開始發軔，但是在半導體產業的總動員則是因2023年的AI晶片先進封裝的產能吃緊。由於先進封裝的產品供應鏈拉得很長，參與者眾，半導體業界就想起業內常見做法（common practice）—制定標準規格，以降低價值鏈各環節間協作所需要的溝通成本及時間。考慮制定標準規格的時候需要考慮的因素主要從技術開始，制定標準的挑戰主要有下列幾點。第一個是先進封裝目前還處於發展初期，技術變遷快速。以2.5D先進封裝為例，初期的就有CoWoS-S、CoWoS-L、CoWoS-R、CoPoS甚至CoWoP等，這還只是一家公司的規格。快速進展的技術來不及制定標準規格，也不一定值得訂定。由於牽涉到的是封測環節，要列入考慮的因素就遠比晶片關注的電性指標要多，必須包含熱（thermal）、機械（mechanical）、可靠性（reliability）、翹曲（warpage）、應力（stress）等特性，種類繁多，制定不易。再來是材料的種類也比較複雜。單只是基板（substrate）一項，就有矽晶圓、玻璃等，現在碳化矽（SiC）也可望入列，其他環節也是新材料的創新場域。既然有標準規格，自然就會有伴隨的量測和檢驗，但是先進封裝通常會牽涉多個晶片，其結構及電性、功能的檢測複雜的程度依整合的程度指數上升。這些挑戰在晶片設計時就必須考慮在內，也賦予以前線路設計界術語如design for testing、design for manufacturing、design for reliability新的意義。另外，新的檢測項目就要有新的測試設備，這一切都還有待發展。所以即使產業中有制定標準規格的念想，至今被產業界廣泛接受規格事實上很少，小晶片（chiplet）的UCIe（Universal Chiplet Interconnect express）3.0在2025年８月被持續推出，算是比較成功的案例。以上的觀點大部分是從技術的考量來看，但是影響元件規格制定的，經濟上的考慮恐怕是更重要的因素。半導體產業界中最成功、最知名的規格標準化元件當屬DRAM。自1993年JEDEC制定SDRAM（Synchronous DRAM）標準後，後續演化的各高階版本延用至今，成為電子系統廠商與半導體元件廠商的共用標準。要制定一個產品的規格要有幾個先決條件。首先，產品的市值規模要夠大，這樣殫精竭慮地協商、規劃未來的產品統一規格才有價值。再來就是技術的路標明確，此點前面已經闡明。有統一的產品標準，意味著元件廠商不必與電子系統廠商在介面規格上密切協商，元件產品推出的週期得以加速，系統設計也可以獨立進行。統一的標準也縮小產品競爭的範疇：規格一致，產品的效能也一致。不同廠家能用於競爭的只有產品的推出時間、產品的可靠性以及生產成本。對於經濟上較有直接影響的—正面或負面的—是產品標準化以後具有大宗商品（commodity）的特性。大宗商品，即使生產廠家數目接近寡頭壟斷，還是個完全競爭市場。這對於買家當然是福音，因為購買的成本會最佳化。對於賣家也有些自然的好處，市場價格低時會促使買家使用較多數量的產品。因為電子系統的效能有如薪資，有向下的僵硬性，因此市場規模即使在市場不景氣時還會不斷的擴大。大宗商品市場自然也有其天生的缺陷。由於缺乏買方與賣方的粘滯性，當供需失衡時—即使缺口不大，價格的起伏會急速的傾斜，這便是大宗商品市場經常面臨的景氣週期問題。市場的景氣週期如果處於低迷階段，又恰好遇到市場外的問題—譬如金融危機，那就是傾家蕩產的時刻。事實上，目前記憶體市場的寡頭壟斷局勢就是在上次景氣大低潮時淘洗剩下的狀況。制定先進封裝規格標準社群最推崇的經典案例是HBM。HBM是由DRAM數層堆疊而成，上下之間以矽穿孔（TSV）來連通電源、信號，這是典型的3D堆疉先進封裝。HBM的規格沿襲DRAM的優良傳統，規格已制定至HBM4、HBM4e，雖然現在產品實際只用到HBM3e。看似HBM是先進封裝規格標準制定的經典範例，但是廠商已經放話了：要在DRAM晶片堆疊的底層置入邏輯線路的基底晶粒（base die），以針對特定客戶的客製化。看，這是寡頭壟斷產品業者的意向—邁向客製化而非標準化，而這意向自然是業者考慮自身利益最大化的結論。綜合目前先進封裝技術進展的狀況以及經濟面的考慮，我認為先進封裝規格標準的制定以及產業界的接納還有一段很長的路要走。

AI是插畫助手，還是插畫家？

我過去創作插畫，必須親手完成所有細節。有了AI，只需勾勒輪廓，它便能自動補全。起初它常誤解原意，畫面失去神韻，例如我畫的Julie Andrews白描稿在AI生成後嚴重走樣。但經多次訓練，它逐漸掌握我的風格，這讓我驚覺：AI是否正從助手邁向取代插畫家？數位時代的商業插畫、遊戲設計與小說封面皆採主畫家與助手分工：前者掌構圖與人物，後者負責上色與背景。AI正改寫這一模式。它能生成完整場景與統一風格的角色，甚至依文字指令完成整幅作品。於是問題浮現：當AI成為主要執行者，作品還能稱為「插畫家的創作」嗎？傳統分工清晰，例如日本工作室由主畫家定構圖神韻，助手執行上色修飾。AI的價值，在於接手重複性高的技術任務。Midjourney、Stable Diffusion與DALL·E等工具能精準模擬筆觸與光影。插畫家輸入草圖或文字描述，AI即可快速生成背景與配色。有畫家稱它是「永不疲倦的助手」，能即時測試多種風格方案。然而，當AI能力逼近人類，界線日益模糊。若AI負責大部分視覺產出，插畫家是否仍為創作者？法律上，只要人類給予明確指令並審核成果，仍屬人類作品；但在倫理與感知上，觀眾已難分辨「人筆」與「機筆」，藝術家的獨特風格也可能被壓縮成演算法模板。插畫家如我者，選擇與AI共生，把繁瑣細節交予AI，自己專注於構圖與概念。例如先手繪草稿，再指令AI生成多種背景方案取其佳者；或在AI生成的服飾光影上再創作，注入筆觸的溫度。這種「AI助筆」模式維持藝術主導權，也提升創作效率。相對地，全由AI生成的插畫雖快速完美，卻缺乏人性的意圖與情感。AI能複製「美」的形式，卻無法體會創作的動機。正如攝影未取代繪畫，AI亦難取代插畫家，但它將重新定義插畫，使創作者更像「導演」，專注於構想與審核，而非執筆描繪。這股轉變正重塑教育與產業。傳統插畫訓練強調技藝，如今學院課程已納入AI繪圖，重點轉向提示設計與風格管理。未來插畫家或將成為「視覺策劃」或「美術監製」，其專業核心不在技術，而在圖像敘事與文化感知。我如此禱告，AI或許能取代插畫助手，卻難取代插畫家。真正的創作超越圖像輸出，重點在於觀點與情感。AI能模仿風格，卻不懂其精神。當人類視AI為協作夥伴而非敵手，插畫藝術將邁入新紀元：從筆尖延伸至演算法，從勞動密集轉向創意驅動。最終，AI取代的不是插畫家，而是耗損創作熱情的重複勞務。人類插畫家的價值，仍在於以想像構築世界，並以情感賦予畫面靈魂。我如此期盼。

宏觀量子穿隧效應的應用

2025年諾具獎頒給John Clarke, Michel Devoret, 和John Martinis等3人，以彰顯他們在宏觀量子穿隧效應（macroscopic quantum tunneling effect）實驗的貢獻。「宏觀」這兩個字是相對應於傳統上對量子現象瞭解的誤解。經典物理（classical physics）指的是牛頓力學（Newtonian Mechanics）可以描述的現象，一般指的是宏觀世界發生的種種現象，而量子現象，一般的解釋方法是在微觀（microscopic）世界中因為物理尺度微小、粒子個別行徑的原因，物體（特別是個別粒子）行徑帶有機率的特性。特別是微觀量子穿隧效應，此現象經常用來彰顯經典物理與量子物理的差異。穿隧效應是指1個粒子在其行進路徑中遭遇一個位勢壁壘（potential barrier）的反應行為。在經典物理中，如果粒子的能量不足以克服位勢壁壘，則情況有如開車遇到山，只能就此折返。如果我們一定要這個電子越過此位勢，只能賦予此粒子足夠的能量，克服位勢所造成的壁壘。在半導體元件中，這已是常用方法。譬如在FLASH中要將電子儲存於浮動閘極（floating gate）中，施加強大的垂直電壓便能將電子從通道中跨越過橫亙於通道與浮動閘極之間絕緣體所形成的位勢壁壘，這就是在FLASH中的Fowler-Nordheim tunneling。這樣的穿隧效應符合經典物理的圖像，要越過壁壘只能靠增加能量。然而在量子世界中，能量不足的粒子即使遭遇到了位勢壁壘，仍然有機率穿越位勢到達另一端。以之前的山與車的用語為例，彷彿在山體中開了一個隧道讓汽車通行，因以為名。微觀量子穿隧效應是量子力學（quantum mechanics）中的經典範例，普遍見於教科書中。但是接下來的問題是自上世紀量子力學發靱後經常被問起的：微觀世界的現象止於什麼尺度？或者更直接的問題：宏觀的世界也可以看見量子現象嗎？特別是量子穿隧效應。 Clarke等3位元物理諾貝爾獎得主於1984~1985間一系列的實驗工作證實在宏觀世界也可以有量子穿隧效應，而且宏觀的物理量也存在量子化的情形。他們的實驗是利用約瑟夫森結（Josephson junction）來檢視電流的量子穿隧效應。約瑟夫森結兩側是超導體，中間隔有Al2O3的鋁基絕緣體。超導體在臨界溫度（critical temperature）以下電子的流動是以庫柏對（Cooper pairs）的方式運動。庫柏對是一對電子之間以聲子（phonon）配對而輕微的彼此束縛，2個電子具有相反的動量和自旋。庫柏對的束縛雖然微弱，但是兩個組成電子的距離可以高達數百奈米，比現在最小電晶體通道的十幾納米大多了。庫柏對在移動時沒有電阻，這就是超導體名字的由來。一個電子的自旋是1/2，在統計上的特性是費米子（Fermion）；而一個古柏對自旋是0，在統計上的特性是玻色子（Boson）。許多玻色子可以凝聚（condensate）於同一個基態（ground state）而形成一個宏觀量子態。約瑟夫結的兩邊超導體之間隔有絶緣體，如果電流值在臨界電流（critical current）之下，在經典力學中一邊的電流是無法通過絶緣體流到另一邊的。但是Clarke等3位的實驗在謹慎的排除外在干擾如熱、微波等因素後，證實在臨界電流值以下的電流仍可以量子穿隧至絕緣體的另一方，這就是宏觀的量子穿隧效應。這個穿隧效應與以前習見的量子穿隧效應很不一樣。量子穿隧效應的經典例子是將粒子（He的原子核，帶有2個正電荷）困於一個位勢陷阱（potential well）之中。此粒子可以用量子穿隧逃逸至陷阱之外，但是此例中的粒子是個別粒子，而此現象是微觀量子穿隧。而Clarke等3人的實驗證實宏觀量子穿隧的真實存在。另外他們也發現此宏觀量子態具有量子化能階（quantized energy level），此點與我們熟悉的微觀世界行徑相仿—譬如氫原子的能階也是量子化的。這是觀念上的突破，是以得獎。在應用上，宏觀量子穿隧效應大幅提升量子效應在真實世界可以被利用的可能性。在前述的實驗中，約瑟夫森結上的電流量子穿隧時會誘發瞬間電壓的變化，而電流與電壓均是宏觀的物理量，可以很容易被觀察量測，這是宏觀量子穿隧效應在應用上可能優於微觀量子效應的原因之一。以現在最具議題性的量子計算為例，發展最迅速的的技術之一是超導量子位元（superconducting qubits），它們都使用約瑟夫森結當成量子位元的基礎架構。超導量子位元又有幾種類型，最常用的是傳輸量子位元（transmon qubit）。傳輸量子位元雖然沒有使用宏觀量子穿隧效應，卻也使用宏觀量子態的量子化能階當成量子位元的0與1。另一種超導量子位元是相量子位元（phase qubits），此處的相是指在約瑟夫結兩邊的宏觀量子態之間的相對相位。如果把此相位當成一個虛擬粒子，此相粒子真的是靠宏觀量子穿隧效應在絕緣體的左右穿梭。類似的應用還有耳熟能詳的超導量子干涉儀（Superconducting Quantum Interference Device；SQUID），它可以用來測量極細微的磁場，敏感至10−15 T（Tesla）。超導量子干涉儀是由2個以上的約瑟芬森結環繞成圈所組成的儀器，利用通過此圈的磁通量（magnetic flux）的變化引發SQUID上電流和電壓來量測磁場大小。SQUID之所以能夠如此精確的量測磁場的原因，也是因為約瑟芬森結中宏觀量子態的能階也是量子化。人類文明進展迄今，已經開始在觸碰物質結構的邊界，量子世界已是可以觀察、甚至可以操控的現象。宏觀量子穿隧現象給我們一個啟示，不限於宏觀量子穿隧、也不限於約瑟夫森結，只要有宏觀量子態，便有宏觀的物理變數可以用於觀測、操控此系統，而這正是我們走到奈米、埃（angstrom）尺度時出現的及時雨。

想像力擴增AI時代的能力

在AI快速發展的數位時代，我們常談演算法、效率與算力，但真正決定AI能否成為「擴增能力」工具的關鍵，不是技術本身，而是人類是否具備想像力。想像力，讓我們敢於提出不同的問題。當孩子仰望夜空，問：「為什麼月亮會跟著我走？」多數大人會回答光線與距離的原理。雖然正確，卻抹去問題背後的驚奇。若改說「因為月亮想陪你回家」，孩子的笑聲才是最有創意的理解。這種回答不是科學事實，而是一種想像練習，提醒我們在理解真實之餘，也別失去感受世界的方式。吉卜林（Joseph Rudyard Kipling）在《就是這樣的故事》（Just So Stories, 1902）也以此方式回應「為什麼」。〈駱駝怎麼長駝峰〉、〈小象怎麼得到長鼻子〉、〈豹怎麼有了斑點〉，這些故事並非科學解釋，而是透過荒誕的情節創造新的「真實」。重複與韻律讓故事像咒語般朗朗上口，而親密的語調則讓它成為親子之間的共享語言。它們不是說教，而是透過幽默與幻想，培養孩子的好奇與創造。這正提醒我們：想像並不是錯誤資訊，而是與真實並行的另一種創造能量。這樣的思維正是我們在AI時代所需。AI能生成文字、影像、方案，但若缺乏人類的想像力，它不過是冷冰冰的輸入輸出。只有當我們以孩童般的好奇來提問，並以創意去引導，AI才會展現真正的擴增效能。重要的是，我們必須分辨：AI有時生成虛構或錯誤（所謂「幻覺」），這些並非可靠資訊，但若經由我們的判斷與引導，這些虛構元素也能成為啟發新想法的原材料。AI可以提供「是什麼」的答案，但「為什麼」與「如果不一樣呢」仍須人類來追問。就像吉卜林的故事，它們延續人類自古以來用神話解釋世界的傳統。AI今日同樣能生成新故事、新情境，但要轉化為啟發與價值，仍取決於我們的想像與判斷力。因此，在AI數位時代，想像力不是奢侈的附加品，而是核心能力。科學說明規律，AI延展邊界，而想像力則確保我們不會在效率中迷失。當我們勇於像孩子般問出「月亮為什麼跟著我」時，AI才能真正陪伴我們，開啟新的旅程。不是因為它替代真實，而是因為我們用想像力為它注入新的可能。

Energy + Intelligence：AI競賽新指標

過去幾年，全球大型語言模型（LLM）的早期競賽幾乎都圍繞在「評測指標」上。矽谷公司們所引領的這場「AI軍備競賽」，倚賴公開評測基準（benchmark）來展現AI實力：從 MMLU 的跨學科知識、BBH的複雜推論、GSM8K的數學應用、HumanEval的程式設計，到HellaSwag的常識推論、以及Winogrande的語境理解，這些測試成了模型在賽場追逐的技術指標。敘事也極為直接：分數代表能力，分數就是王道。於是，技術優化的路徑幾乎被鎖定——設計更大的模型、注入更多的資料、投入更龐大資本、集中高密度運算資源。然而，當各家模型在標準化測試中不斷刷新紀錄，「這些評測是否真能代表真實場域」的疑慮也隨之浮現。為了凸顯AI的場域能力，2024年起，Google與 OpenAI 先後嘗試讓模型挑戰國際數學奧林匹亞（IMO）題目，被視為複雜推論的終極考驗，但這些挑戰，終究無法反映大眾日常的使用場景。於是，美國柏克萊大學研究團隊打造的Chatbot Arena，透過大規模真人盲測，讓使用者的「體感」直接成為裁判，建立一個更貼近市場的「用戶價值」新戰場。同時，開源社群則以下載次數、社群優化程度作為佐證，強調模型在實際應用中的應用性。於是，在傳統基準分數之外，用戶體驗與主觀感受逐漸成為另一個攸關勝負的評價指標。對於後進者而言，要在AI競賽中打破既有格局，必須找到不同的切入維度，創造出非對稱的攻防空間。這在中國科技公司身上表現得尤為明顯：一方面受制於地緣政治，高階晶片的取得受限；另一方面則處於內部競爭極度激烈的環境。在雙重壓力下，他們不僅追逐「效能極致」，更積極在「系統層」尋求突破。透過垂直整合，挑戰者試圖以降低訓練與推論的「成本」作為切入點，將AI的價值主張，從單純比拚模型「智慧高度」，拓展到「商業效益」的務實層面。這意味著，競爭焦點從「誰更聰明」、「誰的體驗更好」，進一步擴展為「誰更務實」：除了「能不能做到」、「好不好用」，還得回答「能不能普及」。 AI 競賽中積極追趕的Google，發揮自身在資料中心的多年經驗，提出另一個關鍵指標，永續（Sustainable）LLM。在最新發表的研究中，Google 團隊揭露：當用戶發送一個文字提示（prompt）給Gemini模型時，平均需要消耗 0.24 Wh能量、0.03克二氧化碳，以及0.26毫升水。換句話說，1次文字生成的能源成本，大致相當於看電視9秒鐘，或飲用5滴水的等效能耗。需要注意的是，這些數據是以Gemini應用的能耗「中位數」文本提示為基準，並僅限於文字問答場景，尚未涵蓋影像或影音等更複雜的生成任務。此外，研究範圍也只涉及推論（inference）階段，而不含更高能耗的訓練過程。即便如此，這份報告仍讓外界難得窺見營運中大型語言模型背後的「AI 能源帳單」。根據其他研究，目前 LLM 的訓練與推論能耗比例約為4 : 6，顯示推論已成為整體AI能源足跡中不可忽視的主角。更有意思的是，透過這個研究，我們也看到大模型推論時，各能耗的佔比。結果顯示，AI加速器（TPU/GPU）消耗約58%的能量，接著是主機CPU與記憶體約佔24%，而資料中心的基礎設施負擔（包含冷卻、電力轉換等overhead）與備份／高可用性設備共佔約18% 。這樣的分布非常值得注意：超過一半的能源用在模型運算本身，然而近乎一成也不能被忽略地用於「系統維持與可靠性保障」的功用。更讓人驚訝的是，Google 報告同時指出，在過去一年，透過硬體（如 TPU、通訊、儲存等）與軟體堆疊的優化，AI 推論的能耗1年內降低33倍，碳排放則下降44倍。這顯示能效提升的速度，遠遠超過我們對摩爾定律的想像。顯然在系統層級「Energy + Intelligence」共同考慮下，存在非常大的發揮空間。能源不僅是珍貴資源，更界定AI智慧的邊界，也迫切需要永續潔淨能源的支持：因為「淨零碳排」（Net Zero）要求。在這方面，Google 已逐步展開布局：在碳會計的Scope 2範疇（購買電力的間接排放）中，近年持續加碼全球各地的再生能源採購，包括太陽能與風能，主動透過市場簽訂長期的潔淨能源合約，確保資料中心與業務能獲得穩定的低碳電力。同時，Google也嘗試將資料中心轉換為綠能資產，並藉由參與電網的「需量反應」（demand response）服務，於尖峰時段調整用電量，提升電網穩定。可以預見，隨著大型語言模型進入「效率優化」的新階段，系統層級的調校將比單純模型演算法更為關鍵。Google 報告中已開始納入Scope 1、Scope 2與Scope 3的碳排放計算，而Scope 3更直接牽涉到供應鏈：從晶片、伺服器、網通零組件到各類供應商的碳排責任，最後都會加總進國際雲端與AI營運商的ESG帳本。如果國際CSP大廠、前瞻AI模型公司加速要求供應鏈提供ESG指標，我們在地的ICT供應商，是否已經準備好？這意味著ESG不再只是合規清單，而是全球市場透明度與競爭力的核心要求。對台灣ICT產業而言，大語言的永續指標至少帶來3個啟示：第一，效能不再是唯一圭臬，效益才是。晶片與伺服器不只要快，更要省，否則難以在全球 AI 供應鏈中站穩腳步。第二，Net Zero正在成為產品競爭指標，能源效率與碳排揭露將成為跨國合作的必要條件。第三，治理力就是競爭力——能否把算力、能耗與永續整合進企業敘事，將決定企業在全球舞台的份量。AI的新指標已經浮現：從技術到商業，再到責任與環境（能源）成本，AI競賽的下半場將不只是「誰更聰明」，而是「誰能在智慧與能源之間找到平衡」。對產業而言，同時考量「Energy + Intelligence」，是產品策略與產業定位的新常態。

維度詛咒

我所專注的電信系統評估，需要調整多個參數，往往得畫出數百張效能評估圖來找出最佳解答。最常面臨的問題之一是所謂的「維度詛咒」（Curse of Dimensionality）。當資料的維度（亦即參數）增加後，要找到所有可能參數組合的困難度會迅速倍增至無法處理的地步。維度詛咒的挑戰，正如我們在AI或大數據領域所面臨的困境：當資訊過於龐雜，人類必須尋找方法「降維」，才能以有限的視角理解無窮的世界。這個問題由發明動態規劃（Dynamic Programming）的理查・貝爾曼（Richard Bellman, 1920～1984）所提出。他的「維度詛咒」警告，提醒我們在多維度情境下計算與搜尋的困境。後續並沒有單一數學家「解決」這個問題，而是透過一系列方法來部分緩解，例如降維（Dimension Reduction）、主成分分析（PCA）、隨機投影等。在眾多相關學者之中，戴爾可尼司（Persi Diaconis；1945年生）的故事特別引人入勝。他出生於音樂世家，曾在世界著名的茱麗亞學院（The Juilliard School）研修小提琴近9年。14歲時，他遇到美國魔術大師維農（Dai Vernon, 1894～1992），覺得魔術比拉小提琴更有趣，於是逃家跟隨維農各處巡迴表演。16歲時，他獨立行走江湖賣藝。24歲時，他深感魔術技巧進入瓶頸，應該尋求一些理論基礎，以提升他的表演。因此，他在書店找到一本機率的入門書《Introduction to Probability Theory and Its Applications, Vol. I》，由斐勒（William Feller, 1906~1970）所寫。結果發現難以理解，於是決定進大學學習機率。最終，他成為史丹佛大學統計系的Mary V. Sunseri講座教授。戴爾可尼司並沒有「解決」維度詛咒，但他的研究在隨機性、馬可夫鏈與高維幾何方面提供降維與分析的啟發，對相關領域影響深遠。當維度降到2或3時，結果就能以統計圖表呈現。常用的統計圖表包括圓餅圖（Pie Chart）、曲線圖（Line Graph）和條狀圖（Bar Graph）。許多人以為圓餅圖是由南丁格爾（Florence Nightingale, 1820～1910）所創，事實上，最早的圓餅圖是由英國工程師暨政治經濟學家普萊菲（William Playfair, 1759~1823）所發明。他曾擔任發明蒸氣機的瓦特（James Watt）的助理，幫忙繪製工程圖，也參與不少發明。他在1801年的著作《統計學摘要》（Statistical Breviary）中首次使用圓餅圖，顯示土耳其帝國在亞歐非三洲所佔的面積。南丁格爾的貢獻則在於善用圖表來推動改革。她在克里米亞戰爭中觀察到病死的士兵遠多於戰死者，但僅靠數字報告難以引起重視。於是她創造了一種玫瑰圖（Coxcomb diagram），這是一種與圓餅圖相似的放射狀圖表，用以強調護理改革的成效。她的圖表設計雖然被部分統計學家批評「不易精確比較」，但在當時確實發揮巨大說服力，讓英軍投入更多資源改善醫療條件，拯救無數生命。相較於圓餅圖，條狀圖在大部分情境下表達訊息更好。條狀圖同樣是由普萊菲所發明，他常說「文不如表，表不如圖」: 這句話也是我寫論文時所奉行的準則。在愛丁堡有一條樓梯小徑紀念普萊菲。他的名字也取得很妙。我常說：「Playfair used graphs and charts to play fair」。

計算半導體(二)：量子計算

人工智慧雖好，但也有為人熟知的缺陷。機器學習訓練時需要有大量的資料輸入，而且在建立模型時，有天然的「維度詛咒」（curse of dimensionality）維度是指一筆資料的特徴（features）數目，在資料空間中，這類資料就需要此特徴數目的維度空間中的點來表達。以製程為例，資料的特徴可能就包含溫度、時間、長度、厚度等等參數，這個數目就是資料的維度。空間的維度一旦變高，空間的體積成指數成長，即使有巨量的資料，在如此龐大的空間中資料點顯得稀疏（sparse），傳統的機器學習變得無法輕易的取得資料的相關性，有效的模型難以建立。但是對於量子計算而言，維次不是問題，至少在通用容錯量子電腦（universal fault tolerant quantum computer）出來之後絕對不是問題。量子電腦每增加1個量子位元，它可以處理的空間維次數目就可以翻倍，所以對於具有許多特徴（或者參數）數目、較少的資料群體，用量子電腦來執行機器學習就有顯著優勢。 2025年在Advanced Science由Zeheng Wang等發表的論文 “Quantum Kernel Learning for Small Dataset Modeling in Semiconductor Fabrication: Application to Ohmic Contact”應用量子計算於氮化鎵（GaN）高遷移率電晶體（High Electron Mobility Transistor；HEMT）的量子機器學習研究，顯示量子計算在少量資料—僅有159筆資料—的狀況下，其預測表現遠優於傳統機器學習，預測數據也與實驗結果相吻合。這個研究的題目就是在矽晶圓上外延（epitaxy）長氮化鎵/金氮化鎵的夾層，在2種材料的介面處形成一個HEMT的二維電子氣體（2 Dimensional Electron Gas；2DEG）通道（channel）。電子通道中的電子是由GaN及AlGaN所注入（injection）的。為了能夠讓AlGaN端能有充份的電子注入，必須於AlGaN上長有金屬堆疊（metal stack），並且與AlGaN的介面形成歐姆接觸（Ohmic contact）。這樣的層層堆疊之後，通常需要退火（anneal）的過程以穩固其分子結構。本研究的目的就是在建立在各種材料厚度、金屬堆疊種類、退火溫度及時間等參數的模型，藉以尋求歐姆接觸的最優解。量子計算處理這個研究的方法與傳統機器學習的方式有部分大致雷同—這也比較容易公平的比較二者的優劣。首先將製程的37個參數以主成份分析（Principal Component Analysis；PCA）簡化成5個參數，然後用變分自動編碼（Variational AutoEncoder；VAE）合成新增資料，可以將樣本數擴大。這兩個步驟在量子計算與傳統的機器學習中都一樣實施，目的在簡化模型建立的複雜度、增加樣本數目。量子計算比較不同的是將簡化後的5個參數映射到5個量子位元上，實質上是將一個5維的空間嵌入一個2的5次方—32維空間中。然後在此高維度空間中以量子核（quantum kernel）兩兩比較各資料的相似性（similarity）。量子計算比傳統機器學習的優勢為在高維度的空間中資料的非線性（non-linear）特徴比較容易顯現，所以其所建立的模型比傳統機器學習的要較精確。這個量子計算於半導體製程的應用其實是在傳統電腦上模擬量子位元及量子機器學習所得到的結果，但是模擬無礙於證明量子機器學習的優越性。量子計算新算力的加入對於半導體的研發意義重大。僅憑少數的資料，就可以建立參數數目巨大的模型；工程批的數目可以大幅減少，研發時程縮短、經費下降。摩爾定律雖然面臨較過去嚴峻的挑戰，但是半導體產業增加新經濟價值的步伐因有諸種算力的加入而未曾放緩。

計算半導體(一)：第一原理計算與機器學習

現在的半導體廠高度依賴計算能力。2000年後才引進的計算方式主要包括第一原理計算（first principles calculation）和機器學習， 2025年又即將加入量子計算。我將這些方法稱之為計算半導體（computing semiconductors）。第一原理計算是指由最基礎的物理學底層出發，包括量子力學、電動力學（electrodynamics）等，用以計算材料的諸種性質。第一原理計算於1970~80年代在凝態物理（condensed matters）和量子化學（quantum chemistry）成為標準稱謂。在1980~90年代，一些半導體大廠的實驗室如IBM，Bell Labs和NEC開始用它來計算高介電值物質（high k dielectrics）、缺陷（defect）、異質結構（heterostructure）等。 2000年後因為第一原理計算的套件廣泛開發與商業化，以及計算機算力的大幅提升，許多半導體公司將其整合入研發的工作流程之中。2010年後，第一原理計算已經變成各大晶圓廠的研發標準工具。第一原理計算的應用例子包括高介電值物質（如HfO2、ZrO3等）、缺陷及可靠性模型、新通道（channel）材料（如Ge、III-V族等）、二維材料（如MoS2、WSe2等）。第一原理計算幾乎可以涵蓋晶格材料的所有性質，包括能帯寛（bandgap）、電場、磁場、自旋（spin）、電子傳導（transport）、熱（thermal）、振動（vibration）、光學（optical）等性質。第一原理的計算在搭建晶格結構時依所欲建構材料的原子種類、共價鍵（covalence bond）長度、晶格對稱（lattice symmetry）、相位（phase）等因素來組織材料，宛若堆疊樂高。也有能力故意在晶格中空出一兩個位置，形成空隙（vacancy）；或者加入其他類原子，形成摻雜劑（dopant）；甚至形成錯位（dislocation），這就是半導體製造過程中有意出現的結構或無意出現的缺陷。不同的分子結構亦可設法連接在一起，這就是2種材料的介面（interface）。現在的半導體元件微縮近乎極限，材料的本體（bulk）部分差不多就恰好只能實現電子該有的傳導性質。由於本體部分日益單薄，介面性質的重要性逐漸增加，因此成為半導體材料研究的重要題目。總結一下，第一原理在半導體目前最重要的應用有三：一是材料的能帶結構與電性（electronic properties）；二是缺陷、摻雜劑和可靠性的分析；三是下世代元件新材料的開發。使用第一原理計算大幅的降低原先試產批（pilot lots）的使用，也縮短開發時間。雖然學術界在2000年起就有如晶圓缺陷分類、良率分析等大數據的應用，但是現代意義的卷積神經網路（Convolutional Neural Network；CNN）在2015年後才開始應用於晶圓圖模式識別（wafer map pattern recognition）。接下來掃描式電子顯微鏡影像分析（SEM image analysis）以及缺陷檢測（defect inspection）也開始以機器學習來處理。到了2017年以後，主要的半導體設備製造商以及晶圓廠開始應用機器學習於缺陷檢測、曝光熱點偵測（lithography hotspot detection）、製程監控（process monitoring）等。 2020年後機器學習的技術日趨成熟，於半導體工作流程中被廣為採用，包括用於良率學習（yield learning）的晶圓圖缺陷聚集（wafer map defect clustering）、光罩合成（mask synthesis）及光學鄰近效應修正（Optical Proximity Correction；OPC）、熱點檢測（hotspot detection）、自動光學檢查（Automatic Optical Inspection；AOI）、預測性維修（predictive maintenance）等。大致上透過高維度、巨量資訊的分析及圖形辨識（pattern recognition）監控工廠及提升工作效率。由於機器學習的深度滲透，整合後的結構形成智慧製造（smart manufacturing）、虛擬工廠（virtual fab）、虛擬晶圓（virtual wafer）更有效率的製造、研發系統工具。

IC之音

更多科技行腳

推薦活動

太陽誘電高可靠性元件-Industrial & Automotive

AI與ESG智慧永續跨域整合商機媒合會

IC之音

更多科技行腳

推薦活動

太陽誘電高可靠性元件-Industrial & Automotive

AI與ESG智慧永續跨域整合 商機媒合會

AI與ESG智慧永續跨域整合商機媒合會