鎧俠驅動AI世代儲存革新掌握代理式推論記憶體革命新契機

尤嘉禾／台北
2026/06/16 03:14
分享

鎧俠應用SSD技術高階主管福田浩一（Koichi Fukuda）於 COMPUTEX 2026論壇分享AI時代SSD在推論運算與資料存取架構中的關鍵角色，強調儲存創新將成為Agentic AI的重要推動力。鎧俠

COMPUTEX 2026前夕NVIDIA在台北主辦的GTC（NVIDIA GTC Taipei）大會聚焦於「代理式推論」（Agentic Inferencing）的新發展議題，隨著代理式 AI（Agentic AI）的快速演進，AI模型需要不斷存取龐大的歷史上下文的資料，導致系統效能受限於大量資料進出GPU與傳輸速度的限制，造成AI基礎設施的瓶頸從GPU效率不彰轉變為「資料搬移效率與記憶體容量」的競爭，而HBM與DRAM成本居高不下，SSD記憶體迅速獲得青睞，扮演新世代儲存架構的關鍵角色，全球記憶體大廠鎧俠（Kioxia）憑藉創新SSD儲存解決方案，全力擁抱Agentic Inferencing世代的迅速普及。

鎧俠應用SSD技術高階主管福田浩一（Koichi Fukuda）先生以「Exploring the Critical Role of SSDs in AI」為題，在COMPUTEX論壇做一場聚焦AI與SSD記憶體解決方案為主題的演講，他分析AI推論中由於AI Agents對話與長文本（Long Context）資料的濫觴，產業界積極整合儲存處理器與智慧化軟體平台，有效突破AI推論中的記憶體限制，優化大型語言模型服務的部署效率，這當中底層SSD記憶體創新成為重要的驅動力，尤其是在GPU Direct Storage（GDS）技術的引領之下，將與HBM、DRAM形成更緊密的關係，成為GPU運算下的資料匯聚與存取的核心管道，提升整體Agentic AI的運作效能。

Kioxia大規模推動GDS設計擁抱Agentic AI的普及化

Fukuda介紹鎧俠這次在Computex 2026期間發表重要的SSD硬體產品線，首先依據BiCS FLASH第八代技術，整合CMOS直接鍵合陣列（CBA）技術，並搭載QLC Die 32 層堆疊架構的系列SSD產品線，此技術大幅提升了效能與效率表現，能夠有效地回應市場上快速成長的儲存密集型應用。

再者，針對用在儲存伺服器與跨機櫃儲存系統，面對超大容量與高速資料存取的SSD產品，提供超高容量QLC NVMe SSD解決方案，滿足AI訓練與大規模分析推論的高速存取需求，並一舉推出LC9系列企業級NVMe SSD系列產品線，最高容量達到245.76TB，實現超大規模資料的快速存取速度與高可靠性。

支援CMX儲存架構優化AI GPU工作負載

特別值得一提的，對於加速AI運算與強化記憶體擴充能力為訴求，針對NVIDIA提出情境記憶體儲存（CMX）架構以解決長文本的設計，鎧俠將SSD重塑為記憶體擴展層架構，能讓GPU直接存取快閃記憶體，作為HBM的擴展，並在關鍵運算場景中大幅加速資料存取速度，目前推出CM三款系列產品，首先是包含CM9系列，其提供25.6TB TLC容量和3 DWPD耐久度；還有專為高密度AI生成與儲存所規劃的LC系列，以及第三個專為GPU Direct Storage（GDS）應用優化設計的GP系列，具備超高IOPS（每秒輸入／輸出運算次數）、高效能、低延遲的SSD產品線，讓 GPU 可以直接存取並擴充可用記憶體空間，目前新的樣品預計2026年底前開始針對客戶提供樣品。

AiSAQ軟體技術化解企業Token成本的痛點

另外，鎧俠在開放軟體支援上也是其產品成功的重要賣點，尤其是AiSAQ技術的突破，化解企業執行RAG指令花費的成本痛點，該技術解決企業部署AI時資料存取的核心挑戰，透過AiSAQ向量資料庫擴展性技術，成功將向量儲存從DRAM卸載至SSD，能夠在維持具競爭力的RAG指令的工作負載效能之餘，還具備削減高達396倍的DRAM使用量，這對於Agentic AI所需要處理超大規模KV Cache管理與最佳化機制有關鍵的助益，一舉節省企業在高昂Token使用費用的支出，進一步支援台灣電子OEM/ODM廠商與AI基礎設施供應鏈，協助客戶積極整合AI運算、儲存、網路與安全功能的新商機，並掌握Agentic Inferencing高度成長契機。

加入已選取到「關鍵字追蹤」什麼是「關鍵字追蹤」

鎧俠驅動AI世代儲存革新 掌握代理式推論記憶體革命新契機

鎧俠驅動AI世代儲存革新掌握代理式推論記憶體革命新契機