NVIDIA推出Rubin CPX 專為大規模情境推論而打造的新一代GPU 智慧應用 影音
D Book
231
TCA-未來科技館-媒合
Event

NVIDIA推出Rubin CPX 專為大規模情境推論而打造的新一代GPU

  • 陳俞萍台北

NVIDIA推出Rubin CPX,專為大規模情境推論而打造的新一代GPU。NVIDIA
NVIDIA推出Rubin CPX,專為大規模情境推論而打造的新一代GPU。NVIDIA

NVIDIA今日宣布推出NVIDIA Rubin CPX,一款專為大規模情境(context)處理而打造的新一代GPU。Rubin CPX使得人工智慧(AI)系統能以突破性的速度與效率,處理百萬個詞元(token)的軟體編碼與影片生成。

Rubin CPX與全新NVIDIA Vera Rubin NVL144 CPX平台中的NVIDIA Vera CPU和Rubin GPU協同工作。這款整合式NVIDIA MGX系統在單一機架配置下擁有8 exaflops的AI運算能力,可提供比NVIDIA GB300 NVL72系統高出7.5倍的AI效能,同時配備100TB快速記憶體及每秒1.7 PB的記憶體頻寬。

NVIDIA也將提供一個專屬的Rubin CPX運算托盤(compute tray),以滿足客戶希望重複利用現有Vera Rubin 144系統的需求。

NVIDIA創辦人暨執行長黃仁勳表示:「Vera Rubin平台將標誌著AI運算領域的又一次躍進,不僅推出新一代Rubin GPU,更創造名為CPX的全新處理器類別。正如RTX為圖形與物理AI領域帶來革命性的改變,Rubin CPX是首款專為大規模情境AI打造的CUDA GPU,能讓模型同時處理具備數百萬個詞元的推理任務。」

NVIDIA Rubin CPX可在處理長情境時提供最高效能與詞元收益,遠超當今系統設計所能承載的範疇。這讓AI程式碼助理從簡單的程式碼生成工具,轉型為可理解並最佳化大型軟體項目的複雜系統。

AI模型可能需要使用多達100萬個詞元來處理一小時內容的影片,這已經達到傳統GPU運算的極限。Rubin CPX將影片解碼器與編碼器,以及長情境推論處理技術整合至單一晶片,為影片搜尋與高品質生成影片等長格式應用,實現前所未有的功能。

Rubin CPX GPU採用NVIDIA Rubin架構,採用經濟實惠的單晶片設計,搭載強大的NVFP4運算資源,並經過最佳化,可為AI推論任務提供極高的效能與能源效率。

Rubin CPX帶來的進步

Rubin CPX以NVFP4精度技術提供高達30 petaflops的運算能力,實現最高效能與準確性。其採用128 GB 經濟實惠的GDDR7記憶體,可加速處理要求最嚴苛、基於情境的工作負載。此外,與NVIDIA GB300 NVL72系統相比,Rubin CPX的系統專注力提升3倍,在不減緩速度的情況下,大幅提高AI模型處理更長情境序列的能力。

Rubin CPX提供多種配置選項,包括Vera Rubin NVL144 CPX,可結合NVIDIA Quantum‑X800 InfiniBand橫向擴展運算架構,或是搭配採用NVIDIA Spectrum-XGS乙太網路技術與NVIDIA ConnectX-9 SuperNICs的NVIDIA Spectrum-X乙太網路平台。透過Vera Rubin CPX,企業得以實現前所未有的盈利規模,每投資1億美元即可獲得50億美元的詞元收益。

業界領袖選擇Rubin CPX

AI創新者正探索如何以Rubin CPX加速其應用,涵蓋從大規模軟體開發到動態視覺內容分析,以便更深入瞭解動態影像。

Cursor是一家提供高階程式碼編輯器的AI軟體公司,該公司認為Rubin CPX的優勢在於能夠直接在程式碼環境中,透過智慧型程式碼生成與協作工具,大幅提高開發人員工作效率。

Cursor執行長Michael Truell表示:「借助NVIDIA Rubin CPX,Cursor將能提供如閃電般快速的程式碼生成與開發人員洞察,從而徹底改變軟體創作方式。這將把工作效率提升至新高度,並讓使用者能夠將過去無法實現的創意付諸實踐。」

美國生成式AI公司 Runway 將採用NVIDIA技術,幫助創作者以無與倫比的規模與效率,製作出具有電影質感的內容與尖端的視覺效果。

Runway執行長Cristóbal Valenzuela表示:「影片生成技術正迅速發展,朝向情境更長且更靈活的代理驅動創意工作流程。我們認為Rubin CPX是效能上的重大突破,可支援這些要求嚴苛的工作負載,進而建構更通用且智慧的創意工具。這意味著從獨立藝術家到大型工作室的創作者,都可以在作品中獲得前所未有的速度、真實感與掌控力。」

Magic是一家正在開發基礎模型的AI研究與產品公司,以驅動可自動化軟體工程的AI代理。

Magic執行長Eric Steinberger表示:「透過包含1億個詞元的情境窗口,我們的模型無需微調即可完整查看程式碼庫、多年互動歷史、文件與函式庫的情境。這項技術讓使用者能在測試階段時透過對話和存取環境來訓練代理,讓我們更接近自主代理體驗。採用NVIDIA Rubin CPX這類GPU技術,可大幅加速我們的運算工作負載。」

NVIDIA Rubin CPX將獲得完整的NVIDIA AI技術堆疊支援,從加速基礎設施到企業級軟體皆涵蓋其中。NVIDIA Dynamo平台可高效擴充AI推論,在大幅提高輸送量的同時,縮短回應時間並降低模型服務成本。

這些處理器將能夠執行NVIDIA Nemotron系列最新的多模態模型,為企業級AI代理提供最先進的推理技術。針對生產級AI應用,Nemotron模型可透過NVIDIA AI Enterprise軟體平台交付。該平台包含NVIDIA NIM微服務,以及AI框架、程式庫與工具,企業可將其部署於NVIDIA加速的雲端、資料中心與工作站。

Rubin平台以數十年的創新為基礎,拓展NVIDIA開發人員生態系,並提供NVIDIA CUDA‑X程式庫、逾600萬人的開發人員社群,以及近6,000種CUDA應用程式。

NVIDIA Rubin CPX預計於2026年底上市。如欲了解進一步資訊,歡迎觀看NVIDIA超大規模與高效能運算副總裁Ian Buck於美西時間9月9日上午10:00在AI Infra Summit上的主題演講。

關鍵字