「Alpha三人行」優化資料前處理 提升AI問答精準度 智慧應用 影音
DForum0612
Event

「Alpha三人行」優化資料前處理 提升AI問答精準度

  • 鄭宇渟台北

「Alpha三人行」團隊以創新AI問答系統拿下優勝,展現新世代技術實力與實戰解題能力。DIGITIMES攝
「Alpha三人行」團隊以創新AI問答系統拿下優勝,展現新世代技術實力與實戰解題能力。DIGITIMES攝

生成式AI正快速重塑企業的營運流程、產品創新、商業模式與整體生態系,根據MIC公布的調查報告顯示,2024年台灣五大行業有採用生成式AI意願或相關行動的比例已達19%,金融保險業高達25%、製造業則以22%居次。

在運用生成式AI打造AI助理的浪潮下,也有企業發現投入大量資源建置的AI助理回應效果不如預期,選擇將AI專案暫停,無形中導致整體競爭力下滑。

在「2025 雲湧智生:台灣生成式AI應用黑客松競賽」中, 從華新麗華「智慧製造」組勝出的「Alpha三人行」認為,AI助理效果不佳主因源自於資料前處理的chunking過小所致,容易打斷原有的文件段落脈絡,導致AI模型出現理解偏差,回覆內容準確度不足。

為此,團隊提出 以「單頁 PDF 文字量」為Chunk單位的做法,藉此保持自然段落結構與完整上下文,避免語意斷裂。此做法順利達成「增強語意連貫性,提升檢索與回答準確率」、「減少幻覺風險」、「優化使用者查詢體驗」等三大效益,也獲得評審委員的一致認同。

賽前教育訓練課程佳  活用 AI 工具實現創意

「Alpha三人行」團隊以鋼材標準查詢作為測試案例,詢問「ASTM A276鋼種316Ti是否符合EN 10088-3標準」的問題。系統檢索到的內容完整覆蓋了鋼種的化學成分與標準對應,回覆內容忠於來源資料且針對性極高。此AI系統在「檢索相關性」、「答案扎實度」、「回答相關性」等三項指標,測試結果均達到 1.0/1.0的最高評分,展現出在企業知識應用上的高度可靠性。

該團隊運用Amazon Web Services(AWS)雲端服務,打造完整的企業知識問答架構。第一階段將 PDF、PNG、JPG 等文件上傳至Amazon S3儲存服務,第二階段則是以大型語言模型為核心配合Flask API,提供即時查詢服務。

第三階段則利用生成式AI基礎模型託管服務Amazon Bedrock串接大語言模型,確保回應速度與可擴展性。第四階段則是採用雲端運算服務Amazon EC2伺服器支撐API運算,確保系統穩定高效 。整體系統設計兼顧資料上傳、管理、檢索與回覆,讓用戶能輕鬆提問與即時獲得專業答案,也成為獲勝的重要關鍵。

2024年才從台灣大學碩士班畢業的「Alpha三人行」團隊指出,雖然三人都是資訊相關科系畢業,面對生成式AI技術的迅速發展,均對時下主流AI工具完全不熟悉。

所幸在主辦單位規劃的一系列企業數據工作坊、 AWS生成式AI示範工作坊等專業培訓下,加上華新麗華說明鋼材標準的細節後,才能順利在30小時內完整專案製作,並榮獲優勝獎項。

關鍵字