智慧應用 影音
EVmember
member

美輸中縮水版AI晶片沒人要,誰是最大獲益者?

NVIDIA GPU出口中國遭到限制,反倒讓中國的替代產品商機成為令外界注目的焦點。

近期DIGITIMES有幾則報導與評論,談及NVIDIA推出特供中國的2度降規AI晶片H20,但中國客戶意願缺缺一事。值得探討的是,商業潛力龐大的中國內需市場缺口,究竟會由哪家半導體業者得利呢?

2023年10月,美國商務部BIS更新先進計算晶片和半導體製造設備出口管制規則,規範總算力及效能密度(總算力/晶粒面積)上限,受限制晶片包括NVIDIA的A100/A800/H100/H800/L40S系列、超微(AMD)的MI250/MI300系列,以及英特爾(Intel)的Gaudi2系列,之所以中國客戶對採購H20意興闌珊,是因為大語言/多模態基礎模型,已然成為兆級參數的軍備競賽,以H20組建的AI算力叢集,難以支持這般規模的訓練任務。

中系業者的因應之道有四,一是透過各種管道購買更多的A100等受限晶片/模組/板卡;二是透過各種管道購買更多的受限繪圖晶片/板卡;三是自研AI晶片;四是購買中國國內業者的AI晶片。

解法一是建制算力最理想的解方,解法二是沒魚蝦也好的應對作法,但從日前圖森未來被疑偷運NVIDIA A100晶片給中國遭美方阻止並調查,以及阿布達比人工智慧/雲端服務集團G42出脫所投資中國公司股份及切斷中國供應鏈這兩事例看來,美國的圍堵力道只會愈來愈緊。解法一與解法二或早或晚會遭斷糧,並非長遠之計。

解法三為雲端業者自研晶片,中國AI公有雲有阿里雲、百度智能雲、騰訊雲與華為雲等四大巨頭,真正僅供自家雲端服務使用而未對外商業販售者,僅有騰訊採12奈米製程的紫霄,但其與阿里平頭哥的含光800均為AI推論晶片,非供AI訓練使用。

歸納解法一、二、三後可發現,針對雲端/互連網業者及伺服器業者需求的商業AI訓練晶片,才是中國AI算力產業鏈的發展關鍵,參與者包括雲端業者旗下的華為海思、百度崑崙芯及騰訊持股21.37%的燧原科技,以及海光、寒武紀、沐曦、天數智芯、璧仞、摩爾線程、登臨等業者。

會脫穎而出接收這龐大市場缺口的業者,我認為有2個條件:一是在晶片層次,取得中國擁有先進技術的晶圓代工廠、封測廠與記憶體廠的策略性支持;二是在硬體/軟體/應用層次能建立完整的供應鏈/生態系。對獨立的晶片業者來說,即便取巧推動「類CUDA平台」模式,我認為仍具有高度挑戰性,而在大集團旗下,擁有雲端/互連網龍頭業者在後強力支持的業者會更有機會,這其中我最看好華為。

華為與中芯的先進晶片合作,已然成為中國突破美國封鎖的關鍵所繫,海思昇騰910b採中芯7奈米N+2製程,下一代昇騰920則可望推進至5奈米,成為中國內部與NVIDIA H100算力落差最小的晶片。

若從生態系角度來看,華為自己在伺服器主機板上除了AI晶片外,也包括鯤鵬CPU、基板管理控制器(BMC)晶片、網通晶片、與SSD控制晶片等。在其上有對標NVIDIA CUDA+cuDNN的CANN(Compute Architecture for Neural Networks)混合式運算架構,支持主流的PyTorch及TensorFlow及華為自己的昇思MindSpore等多個AI架構,更上層也有完整的算法開發與應用開發的軟體堆疊。

華為伺服器硬體合作夥伴包括華鯤振宇、神州數碼、清華同方、寶德計算機等業者,以及多家應用軟體與SI業者。觀察其客戶名單,已拿下包括百度、科大訊飛及360等指標性雲端/互連網/AI公司及三大電信業者。此外,中國各地都在積極建立AI計算中心,多數的標案均由華為昇騰方案得標,其中包括北京、天津、廣州、杭州、重慶、成都等重點城市等。

在外有美國管制難出海,內逢經濟疲軟影響籌資的大環境下,再加上建立軟硬體生態系的高門檻讓業績拓展無法一蹴可幾,中國新創AI晶片業者普遍面臨營運上的挑戰,2023年陸續傳來寒武紀與摩爾線程裁員、壁仞科技2位創辦人離職的消息。

相較之下,作為中國事業範疇最廣、掌握雲端服務/電信網路到終端裝置、軟硬體垂直整合程度最高、公司也最賺錢的華為,看來是最有底氣接收美國管制下所讓出中國算力市場缺口的業者。若中國政府想要與NVIDIA CUDA脫勾,建立起全然自主可控的算力生態系,除華為外還有更好的選擇嗎?

DIGITIMES副總經理。美國壬色列理工學院(RPI)電機碩士暨台灣大學國際企業所博士候選人,曾帶領DIGITIMES研究中心,並擔任多個政府及企業委託之研究顧問專案主持人,關懷多變局勢下的台灣產業發展之道。