輝達發表Rubin CPX 專攻超長上下文AI推理任務

美國晶片巨頭輝達(NVIDIA)當地時間9日於AI基礎設施高峰會上公布下一代GPU—「Rubin CPX」,鎖定影片生成、軟體開發與大規模推理等需要處理超長上下文的應用場景。這款晶片屬於新一代Rubin架構,將在2026年底正式上市,被視為Blackwell系列的接班人。

「Rubin CPX」標榜能處理上百萬個詞元(token),透過將影片解碼、編碼與AI推理等繁複流程整合於單一晶片,顯著提升效能。其核心平台「Vera Rubin NVL144 CPX」在單一機架中可整合144顆GPU與36顆CPU,算力高達8 exaflops,相較現有GB300系統效能提升7倍以上。專用設計使其能同時應付龐大程式碼庫的跨檔案關聯,以及解析長達一小時影片的數據需求。

輝達表示,「Rubin CPX」的分離式推理架構,能分階段優化上下文處理與生成任務,結合100TB高速記憶體與新一代InfiniBand互連技術,大幅提升運算與記憶體效率。包括Cursor、Runway與Magic等新創公司,已計劃將其導入至程式碼生成、影像工作流以及超大規模基礎模型的建構。

執行長黃仁勳指出,「Rubin CPX」是首款專為「巨量上下文AI」打造的CUDA GPU,「正如RTX曾革新圖形運算,如今CPX將改變推理方式,讓模型能同時處理數百萬詞元的知識。」

業界分析認為,這款晶片不僅展現輝達對AI應用需求的精準掌握,也有助於進一步鞏固其在資料中心與AI基礎設施領域的主導地位。根據預測,輝達今年度數據中心業務營收可望突破1,800億美元,遠超其他競爭對手。【記者  鄒弘整理報導】