NVIDIA推出Rubin CPX 專為大規模情境推論而打造的新一代GPU

陳俞萍／台北
2025/10/02 03:08
分享

NVIDIA推出Rubin CPX，專為大規模情境推論而打造的新一代GPU。NVIDIA

NVIDIA今日宣布推出NVIDIA Rubin CPX，一款專為大規模情境（context）處理而打造的新一代GPU。Rubin CPX使得人工智慧（AI）系統能以突破性的速度與效率，處理百萬個詞元（token）的軟體編碼與影片生成。

Rubin CPX與全新NVIDIA Vera Rubin NVL144 CPX平台中的NVIDIA Vera CPU和Rubin GPU協同工作。這款整合式NVIDIA MGX系統在單一機架配置下擁有8 exaflops的AI運算能力，可提供比NVIDIA GB300 NVL72系統高出7.5倍的AI效能，同時配備100TB快速記憶體及每秒1.7 PB的記憶體頻寬。

NVIDIA也將提供一個專屬的Rubin CPX運算托盤（compute tray），以滿足客戶希望重複利用現有Vera Rubin 144系統的需求。

NVIDIA創辦人暨執行長黃仁勳表示：「Vera Rubin平台將標誌著AI運算領域的又一次躍進，不僅推出新一代Rubin GPU，更創造名為CPX的全新處理器類別。正如RTX為圖形與物理AI領域帶來革命性的改變，Rubin CPX是首款專為大規模情境AI打造的CUDA GPU，能讓模型同時處理具備數百萬個詞元的推理任務。」

NVIDIA Rubin CPX可在處理長情境時提供最高效能與詞元收益，遠超當今系統設計所能承載的範疇。這讓AI程式碼助理從簡單的程式碼生成工具，轉型為可理解並最佳化大型軟體項目的複雜系統。

AI模型可能需要使用多達100萬個詞元來處理一小時內容的影片，這已經達到傳統GPU運算的極限。Rubin CPX將影片解碼器與編碼器，以及長情境推論處理技術整合至單一晶片，為影片搜尋與高品質生成影片等長格式應用，實現前所未有的功能。

Rubin CPX GPU採用NVIDIA Rubin架構，採用經濟實惠的單晶片設計，搭載強大的NVFP4運算資源，並經過最佳化，可為AI推論任務提供極高的效能與能源效率。

Rubin CPX帶來的進步

Rubin CPX以NVFP4精度技術提供高達30 petaflops的運算能力，實現最高效能與準確性。其採用128 GB 經濟實惠的GDDR7記憶體，可加速處理要求最嚴苛、基於情境的工作負載。此外，與NVIDIA GB300 NVL72系統相比，Rubin CPX的系統專注力提升3倍，在不減緩速度的情況下，大幅提高AI模型處理更長情境序列的能力。

Rubin CPX提供多種配置選項，包括Vera Rubin NVL144 CPX，可結合NVIDIA Quantum‑X800 InfiniBand橫向擴展運算架構，或是搭配採用NVIDIA Spectrum-XGS乙太網路技術與NVIDIA ConnectX-9 SuperNICs的NVIDIA Spectrum-X乙太網路平台。透過Vera Rubin CPX，企業得以實現前所未有的盈利規模，每投資1億美元即可獲得50億美元的詞元收益。

業界領袖選擇Rubin CPX

AI創新者正探索如何以Rubin CPX加速其應用，涵蓋從大規模軟體開發到動態視覺內容分析，以便更深入瞭解動態影像。

Cursor是一家提供高階程式碼編輯器的AI軟體公司，該公司認為Rubin CPX的優勢在於能夠直接在程式碼環境中，透過智慧型程式碼生成與協作工具，大幅提高開發人員工作效率。

Cursor執行長Michael Truell表示：「借助NVIDIA Rubin CPX，Cursor將能提供如閃電般快速的程式碼生成與開發人員洞察，從而徹底改變軟體創作方式。這將把工作效率提升至新高度，並讓使用者能夠將過去無法實現的創意付諸實踐。」

美國生成式AI公司 Runway 將採用NVIDIA技術，幫助創作者以無與倫比的規模與效率，製作出具有電影質感的內容與尖端的視覺效果。

Runway執行長Cristóbal Valenzuela表示：「影片生成技術正迅速發展，朝向情境更長且更靈活的代理驅動創意工作流程。我們認為Rubin CPX是效能上的重大突破，可支援這些要求嚴苛的工作負載，進而建構更通用且智慧的創意工具。這意味著從獨立藝術家到大型工作室的創作者，都可以在作品中獲得前所未有的速度、真實感與掌控力。」

Magic是一家正在開發基礎模型的AI研究與產品公司，以驅動可自動化軟體工程的AI代理。

Magic執行長Eric Steinberger表示：「透過包含1億個詞元的情境窗口，我們的模型無需微調即可完整查看程式碼庫、多年互動歷史、文件與函式庫的情境。這項技術讓使用者能在測試階段時透過對話和存取環境來訓練代理，讓我們更接近自主代理體驗。採用NVIDIA Rubin CPX這類GPU技術，可大幅加速我們的運算工作負載。」

NVIDIA Rubin CPX將獲得完整的NVIDIA AI技術堆疊支援，從加速基礎設施到企業級軟體皆涵蓋其中。NVIDIA Dynamo平台可高效擴充AI推論，在大幅提高輸送量的同時，縮短回應時間並降低模型服務成本。

這些處理器將能夠執行NVIDIA Nemotron系列最新的多模態模型，為企業級AI代理提供最先進的推理技術。針對生產級AI應用，Nemotron模型可透過NVIDIA AI Enterprise軟體平台交付。該平台包含NVIDIA NIM微服務，以及AI框架、程式庫與工具，企業可將其部署於NVIDIA加速的雲端、資料中心與工作站。

Rubin平台以數十年的創新為基礎，拓展NVIDIA開發人員生態系，並提供NVIDIA CUDA‑X程式庫、逾600萬人的開發人員社群，以及近6,000種CUDA應用程式。

NVIDIA Rubin CPX預計於2026年底上市。如欲了解進一步資訊，歡迎觀看NVIDIA超大規模與高效能運算副總裁Ian Buck於美西時間9月9日上午10:00在AI Infra Summit上的主題演講。

關鍵字

AI NVIDIA GPU

加入已選取到「關鍵字追蹤」什麼是「關鍵字追蹤」