振生半導體利用國網中心HPC 突破邊緣AI晶片設計瓶頸
物聯網與邊緣運算需求急速成長,具備資安防護能力的邊緣AI晶片成為產業關注焦點。然而,傳統AI模型難以直接對應晶片架構、資安機制與AI推論缺乏協同設計等技術挑戰,成為業界發展的主要障礙。振生半導體利用國網中心H100 GPU高效能運算資源,成功建立從模型設計到晶片驗證的完整技術流程,為台灣邊緣AI晶片產業注入新動能。
振生執行長張振豐表示,邊緣AI產業目前面臨三大技術瓶頸:首先,多數AI模型以雲端或通用型GPU為設計基礎,缺乏針對邊緣晶片的優化流程,無法有效對應PE Array、on-chip SRAM等硬體架構。
其次,現有模型普遍缺乏端點資安保護,未內建輕量簽章或記憶體加密設計,推論過程易遭攔截破解,且資安機制多為獨立模組,整合時產生效能瓶頸;第三,邊緣裝置受限於體積、成本與功耗考量,可用算力與儲存空間大幅受限,而無人機、監控等應用場域需要即時推論反應,無法依賴雲端傳輸,要求AI模型必須具備「地端自主運算」能力。
用HPC提升開發效率 資安模組整合打造差異化優勢
面對上述挑戰,振生藉由導入國網中心H100 GPU資源,在模型訓練、壓縮與模擬流程方面取得顯著突破。技術長羅宇呈指出,公司透過高效能運算支援,團隊能夠同時進行多版本模型的平行訓練實驗,大幅加快開發週期。
在模型壓縮優化方面,振生成功建立支援INT8精度的輕量模型,具備壓縮與快取優化功能,同時保持95%以上準確率。更重要的是,團隊利用H100的算力模擬模型在不同資源配置下的運算特性,包括算子密度、記憶體訪問頻率、算力瓶頸等,為晶片RTL設計、快取配置與控制模組設計提供精準依據。
透過國網中心資源導入,整體晶片設計與驗證週期成功縮短約40%,並建立起可重複使用的模型壓縮與硬體映射工作流程。
羅宇呈提到,振生特別重視資安防護能力的整合。團隊將輕量簽章驗證與記憶體加密模組整合至AI推論流程中,採用端點資安設計理念,使運算完全在地端完成,無需依賴雲端連線,有效提升資料與模型保護層級。
此創新設計在實際應用中擁有明顯優勢。以邊緣端人臉辨識模組為例,該系統可應用於監控攝影機、門禁系統等設備,經過優化後的模型體積縮小至原始的25%以下,推論延遲小於50毫秒,部署功耗降低約30%。
同時,模型可直接部署至具on-chip SRAM與NPU的邊緣AI晶片中,支援身份辨識與資安簽章驗證同步執行。透過本次專案,振生建立起從模型設計、訓練、硬體對應到驗證的完整流程。
團隊已完成視覺推論模型開發,此一完整的技術驗證體系不僅有助於振生未來自主晶片開發時降低時程、成本與風險,更具備轉化為商業IP模組的潛力。成果可延伸為NPU/AI Core模型推論模組設計藍本,供後續IP授權、模組轉售或客製化設計服務使用。
展望未來,振生計畫將現有技術應用拓展至更多領域。在工業控制方面,將資安模組應用於機器視覺與設備控制模組,強化工控系統資料完整性。車載系統領域則導入低功耗AI模型搭配資安驗證機制於ADAS晶片中,增強道路感知與行車安全。
智慧醫療裝置方面,AI結合資安晶片可應用於穿戴感測器與診斷設備,確保資料即時分析並符合隱私保護標準。透過此次成功合作,振生建構出整合模型設計、晶片架構與安全驗證實例,並為台灣本土資安晶片自主研發能量的發展奠定重要基礎,展現政府與產業攜手推動半導體技術創新的具體成效。