數位無限與研華深化合作定義工業AI算力新標準
隨著生成式AI、即時推論與高效能運算(HPC)應用快速擴展,企業對GPU算力的需求持續攀升,然而在實務部署中,昂貴的GPU資源卻長期面臨利用率不彰、投資效益難以放大的挑戰。
AI基礎設施軟體領導廠商數位無限(INFINITIX)近日宣布,透過旗下AI-Stack CTAs(Core Type Aware Scheduler)技術,有效解決GPU核心錯配所造成的算力閒置問題,並攜手工業電腦(IPC)與邊緣運算大廠研華科事業群技(Advantech),共同推出兼具效能與穩定性的企業級與邊緣AI基礎設施解決方案。
數位無限AI-Stack CTAs釋放GPU雙倍效能
現行GPU架構同時包含CUDA Cores與Tensor Cores,分別適用於傳統運算與 AI 矩陣運算。然而在多數企業環境中,不同型態的工作負載往往輪流使用同一張GPU,導致部分核心長時間閒置,使整體GPU利用率與實際效能僅發揮約4成。AI-Stack CTAs(Core Type Aware Scheduler)為業界首創、可於軟體層精準辨識並調度GPU核心類型的智慧排程機制。
透過Kubernetes原生整合與runtime攔截技術,CTAs能將CUDA密集型與Tensor密集型工作負載配對於同一張GPU並行執行,在無需修改應用程式的前提下,將GPU利用率提升至80%以上,實質釋放近2倍算力效益。
AI-Stack為數位無限打造的企業級AI基礎設施管理平台,除CTAs核心調度能力外,亦涵蓋GPU資源管理、多租戶治理,以及模型訓練與推論部署,協助企業以平台化方式管理算力資產,加速AI從實驗走向規模化應用。
攜手研華賦能產業:軟硬整合重塑AI算力價值
在GPU使用效率大幅提升後,系統的穩定性與可靠度成為企業部署AI的關鍵。研華提供通過嚴格工業級驗證的GPU伺服器平台,包含適用於邊緣場域的SKY-602E3塔型GPU伺服器,即使在GPU長時間高負載運作下,仍能維持穩定效能,確保關鍵任務7×24小時不中斷當GPU利用率長時間維持在80%以上,真正的挑戰才正式展開。
為確保被釋放的算力能於實際產業場域中穩定運行,INFINITIX與研華深化策略合作,將AIStack CTAs導入研華工業級邊緣與資料中心伺服器平台,其中以SKY-602E3為代表的塔型GPU伺服器,成為高負載Edge AI應用的理想載體。
SKY-602E3具備多GPU擴充能力與強化散熱設計,並通過嚴苛工業級測試,即使GPU長時間滿載運作,仍可有效避免降頻與非預期停機,滿足電信、製造、醫療等「不容中斷」關鍵任務場域需求。透過AI-Stack與研華伺服器產品線的深度整合,企業得以依據資料中心或邊緣場域特性,彈性部署高效且可靠的AI基礎設施。
數位無限商務長陳立昕表示:「AI-Stack CTAs的核心價值,在於讓GPU中的CUDA與Tensor Core各自發揮、同時運作,真正提升算力使用效率。結合研華工業級硬體在穩定性與耐用度上的優勢,可協助企業在效能與可靠度之間取得最佳平衡,降低AI導入門檻,加速智慧應用落地。」






