鎧俠驅動AI世代儲存革新 掌握代理式推論記憶體革命新契機
COMPUTEX 2026前夕NVIDIA在台北主辦的GTC(NVIDIA GTC Taipei)大會聚焦於「代理式推論」(Agentic Inferencing)的新發展議題,隨著代理式 AI(Agentic AI)的快速演進,AI模型需要不斷存取龐大的歷史上下文的資料,導致系統效能受限於大量資料進出GPU與傳輸速度的限制,造成AI基礎設施的瓶頸從GPU效率不彰轉變為「資料搬移效率與記憶體容量」的競爭,而HBM與DRAM成本居高不下,SSD記憶體迅速獲得青睞,扮演新世代儲存架構的關鍵角色,全球記憶體大廠鎧俠(Kioxia)憑藉創新SSD儲存解決方案,全力擁抱Agentic Inferencing世代的迅速普及。
鎧俠應用SSD技術高階主管福田浩一(Koichi Fukuda)先生以「Exploring the Critical Role of SSDs in AI」為題,在COMPUTEX論壇做一場聚焦AI與SSD記憶體解決方案為主題的演講,他分析AI推論中由於AI Agents對話與長文本(Long Context)資料的濫觴,產業界積極整合儲存處理器與智慧化軟體平台,有效突破AI推論中的記憶體限制,優化大型語言模型服務的部署效率,這當中底層SSD記憶體創新成為重要的驅動力,尤其是在GPU Direct Storage(GDS)技術的引領之下,將與HBM、DRAM形成更緊密的關係,成為GPU運算下的資料匯聚與存取的核心管道,提升整體Agentic AI的運作效能。
Kioxia大規模推動GDS設計 擁抱Agentic AI的普及化
Fukuda介紹鎧俠這次在Computex 2026期間發表重要的SSD硬體產品線,首先依據BiCS FLASH第八代技術,整合CMOS直接鍵合陣列(CBA)技術,並搭載QLC Die 32 層堆疊架構的系列SSD產品線,此技術大幅提升了效能與效率表現,能夠有效地回應市場上快速成長的儲存密集型應用。
再者,針對用在儲存伺服器與跨機櫃儲存系統,面對超大容量與高速資料存取的SSD產品,提供超高容量QLC NVMe SSD解決方案,滿足AI訓練與大規模分析推論的高速存取需求,並一舉推出LC9系列企業級NVMe SSD系列產品線,最高容量達到245.76TB,實現超大規模資料的快速存取速度與高可靠性。
支援CMX儲存架構 優化AI GPU工作負載
特別值得一提的,對於加速AI運算與強化記憶體擴充能力為訴求,針對NVIDIA提出情境記憶體儲存(CMX)架構以解決長文本的設計,鎧俠將SSD重塑為記憶體擴展層架構,能讓GPU直接存取快閃記憶體,作為HBM的擴展,並在關鍵運算場景中大幅加速資料存取速度,目前推出CM三款系列產品,首先是包含CM9系列,其提供25.6TB TLC容量和3 DWPD耐久度;還有專為高密度AI生成與儲存所規劃的LC系列,以及第三個專為GPU Direct Storage(GDS)應用優化設計的GP系列,具備超高IOPS(每秒輸入/輸出運算次數)、高效能、低延遲的SSD產品線,讓 GPU 可以直接存取並擴充可用記憶體空間,目前新的樣品預計2026年底前開始針對客戶提供樣品。
AiSAQ軟體技術化解企業Token成本的痛點
另外,鎧俠在開放軟體支援上也是其產品成功的重要賣點,尤其是AiSAQ技術的突破,化解企業執行RAG指令花費的成本痛點,該技術解決企業部署AI時資料存取的核心挑戰,透過AiSAQ向量資料庫擴展性技術,成功將向量儲存從DRAM卸載至SSD,能夠在維持具競爭力的RAG指令的工作負載效能之餘,還具備削減高達396倍的DRAM使用量,這對於Agentic AI所需要處理超大規模KV Cache管理與最佳化機制有關鍵的助益,一舉節省企業在高昂Token使用費用的支出,進一步支援台灣電子OEM/ODM廠商與AI基礎設施供應鏈,協助客戶積極整合AI運算、儲存、網路與安全功能的新商機,並掌握Agentic Inferencing高度成長契機。





