Energy + Intelligence:AI競賽新指標

徐宏民
2025-09-15

過去幾年,全球大型語言模型(LLM)的早期競賽幾乎都圍繞在「評測指標」上。矽谷公司們所引領的這場「AI軍備競賽」,倚賴公開評測基準(benchmark)來展現AI實力:從 MMLU 的跨學科知識、BBH的複雜推論、GSM8K的數學應用、HumanEval的程式設計,到HellaSwag的常識推論、以及Winogrande的語境理解,這些測試成了模型在賽場追逐的技術指標。敘事也極為直接:分數代表能力,分數就是王道。於是,技術優化的路徑幾乎被鎖定——設計更大的模型、注入更多的資料、投入更龐大資本、集中高密度運算資源。

然而,當各家模型在標準化測試中不斷刷新紀錄,「這些評測是否真能代表真實場域」的疑慮也隨之浮現。

為了凸顯AI的場域能力,2024年起,Google與 OpenAI 先後嘗試讓模型挑戰國際數學奧林匹亞(IMO)題目,被視為複雜推論的終極考驗,但這些挑戰,終究無法反映大眾日常的使用場景。於是,美國柏克萊大學研究團隊打造的Chatbot Arena,透過大規模真人盲測,讓使用者的「體感」直接成為裁判,建立一個更貼近市場的「用戶價值」新戰場。同時,開源社群則以下載次數、社群優化程度作為佐證,強調模型在實際應用中的應用性。

於是,在傳統基準分數之外,用戶體驗與主觀感受逐漸成為另一個攸關勝負的評價指標。

對於後進者而言,要在AI競賽中打破既有格局,必須找到不同的切入維度,創造出非對稱的攻防空間。這在中國科技公司身上表現得尤為明顯:一方面受制於地緣政治,高階晶片的取得受限;另一方面則處於內部競爭極度激烈的環境。在雙重壓力下,他們不僅追逐「效能極致」,更積極在「系統層」尋求突破。透過垂直整合,挑戰者試圖以降低訓練與推論的「成本」作為切入點,將AI的價值主張,從單純比拚模型「智慧高度」,拓展到「商業效益」的務實層面。

這意味著,競爭焦點從「誰更聰明」、「誰的體驗更好」,進一步擴展為「誰更務實」:除了「能不能做到」、「好不好用」,還得回答「能不能普及」。

AI 競賽中積極追趕的Google,發揮自身在資料中心的多年經驗,提出另一個關鍵指標,永續(Sustainable)LLM。在最新發表的研究中,Google 團隊揭露:當用戶發送一個文字提示(prompt)給Gemini模型時,平均需要消耗 0.24 Wh能量、0.03克二氧化碳,以及0.26毫升水。換句話說,1次文字生成的能源成本,大致相當於看電視9秒鐘,或飲用5滴水的等效能耗。

需要注意的是,這些數據是以Gemini應用的能耗「中位數」文本提示為基準,並僅限於文字問答場景,尚未涵蓋影像或影音等更複雜的生成任務。此外,研究範圍也只涉及推論(inference)階段,而不含更高能耗的訓練過程。即便如此,這份報告仍讓外界難得窺見營運中大型語言模型背後的「AI 能源帳單」。根據其他研究,目前 LLM 的訓練與推論能耗比例約為4 : 6,顯示推論已成為整體AI能源足跡中不可忽視的主角。

更有意思的是,透過這個研究,我們也看到大模型推論時,各能耗的佔比。結果顯示,AI加速器(TPU/GPU)消耗約58%的能量,接著是主機CPU與記憶體約佔24%,而資料中心的基礎設施負擔(包含冷卻、電力轉換等overhead)與備份/高可用性設備共佔約18% 。這樣的分布非常值得注意:超過一半的能源用在模型運算本身,然而近乎一成也不能被忽略地用於「系統維持與可靠性保障」的功用。

更讓人驚訝的是,Google 報告同時指出,在過去一年,透過硬體(如 TPU、通訊、儲存等)與軟體堆疊的優化,AI 推論的能耗1年內降低33倍,碳排放則下降44倍。這顯示能效提升的速度,遠遠超過我們對摩爾定律的想像。顯然在系統層級「Energy + Intelligence」共同考慮下,存在非常大的發揮空間。

能源不僅是珍貴資源,更界定AI智慧的邊界,也迫切需要永續潔淨能源的支持:因為「淨零碳排」(Net Zero)要求。在這方面,Google 已逐步展開布局:在碳會計的Scope 2範疇(購買電力的間接排放)中,近年持續加碼全球各地的再生能源採購,包括太陽能與風能,主動透過市場簽訂長期的潔淨能源合約,確保資料中心與業務能獲得穩定的低碳電力。同時,Google也嘗試將資料中心轉換為綠能資產,並藉由參與電網的「需量反應」(demand response)服務,於尖峰時段調整用電量,提升電網穩定。

可以預見,隨著大型語言模型進入「效率優化」的新階段,系統層級的調校將比單純模型演算法更為關鍵。Google 報告中已開始納入Scope 1、Scope 2與Scope 3的碳排放計算,而Scope 3更直接牽涉到供應鏈:從晶片、伺服器、網通零組件到各類供應商的碳排責任,最後都會加總進國際雲端與AI營運商的ESG帳本。如果國際CSP大廠、前瞻AI模型公司加速要求供應鏈提供ESG指標,我們在地的ICT供應商,是否已經準備好?這意味著ESG不再只是合規清單,而是全球市場透明度與競爭力的核心要求。

對台灣ICT產業而言,大語言的永續指標至少帶來3個啟示:

第一,效能不再是唯一圭臬,效益才是。晶片與伺服器不只要快,更要省,否則難以在全球 AI 供應鏈中站穩腳步。

第二,Net Zero正在成為產品競爭指標,能源效率與碳排揭露將成為跨國合作的必要條件。

第三,治理力就是競爭力——能否把算力、能耗與永續整合進企業敘事,將決定企業在全球舞台的份量。

AI的新指標已經浮現:從技術到商業,再到責任與環境(能源)成本,AI競賽的下半場將不只是「誰更聰明」,而是「誰能在智慧與能源之間找到平衡」。對產業而言,同時考量「Energy + Intelligence」,是產品策略與產業定位的新常態。

現任國立台灣大學資訊工程學系教授,曾任富智捷(MobileDrive)技術長暨副總經理,推動ADAS及智慧座艙系統產品進入全球車用市場。紐約哥倫比亞大學電機博士,專精於機器學習、電腦視覺、自駕車、機器人等領域。為訊連科技研發團隊創始成員,慧景科技(thingnario)共同創辦人,NVIDIA AI Lab計畫主持人;曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會,擔任多家科技公司AI策略顧問。
智慧應用 影音