強化空間的安全性:NVIDIA攜手合作夥伴將物理AI技術引進城市與工業基礎建設
NVIDIA目前正利用基於物理AI的感知與推理技術,提升全球營運效能,合作的公司包括Accenture、Avathon、Belden、DeepHow、Milestone Systems與Telit Cinterion。
透過不斷循環模擬、訓練與部署物理AI的過程,提供各種尖端的工業自動化功能,讓城市與基礎建設更安全、更智慧也更高效。
舉例而言,物理AI應用可自動化執行工作人員原具潛在危險性的任務,例如操作重型機械。此外,物理AI還能改善交通運輸服務與公共安全,以及偵測工廠內有瑕疵的產品等。
這方面的需求比以往任何時候都更為迫切,數字正說明了這一切:
有能力感知、推理及採取行動的基礎建設,仰賴影片感測器與最新的視覺AI功能。NVIDIA Metropolis平台簡化了從邊緣到雲端影片分析AI代理與服務的開發、部署及擴充過程,有助於開發者更迅速將視覺感知技術整合至設施,提高各種環境的生產力與安全性。
以下是5家推進物理AI發展的領先公司,以及NVIDIA於今日SIGGRAPH電腦繪圖大會上發表,讓這類技術得以實現的五項關鍵NVIDIA Metropolis更新。
5家推進物理AI發展的企業
全球專業服務公司 Accenture 正與領先的完整連接解決方案供應商Belden合作,透過打造可設置在工廠內大型機器人周圍的智慧型虛擬圍欄,防止與人類操作者發生事故,提高工作人員的安全。
智慧型虛擬圍欄是一種物理AI安全系統,採用OpenUSD技術的數位孿生和物理型模擬技術,為複雜的工業環境建模。這套系統採用電腦視覺技術的地圖建構與3D空間智慧,能靈活因應新式廠房環境中,人機互動的高變動性與多元情境。
Accenture運用NVIDIA Omniverse平台和Metropolis,打造及模擬這類智慧圍欄。Accenture利用Omniverse打造了有機械手臂和作業人員移動的數位孿生場景。該公司先利用Metropolis訓練AI模型,再利用影片擷取技術與NVIDIA DeepStream軟體開發套件(SDK)的即時推理功能,將模型部署於邊緣。
Avathon是工業自動化平台供應商,運用NVIDIA Metropolis適用於影片搜尋與摘要(VSS) 的NVIDIA Blueprint,為製造和能源設施提供即時洞察,提高營運效率並加強工作人員安全。
印度燃油與交通領域的領導業者Reliance British Petroleum Mobility Limited在建設加油站期間採用了Avathon視訊智慧產品,以達成更高的安全合規標準、降低安全違規事件,並透過節省數千工時來提升生產力。
DeepHow為製造業及其他產業的員工開發了「Smart Know-How Companion」。這款輔助工具採用 Metropolis VSS藍圖,將主要工作流程轉換為精簡的多語言影片和數位指引,使職前訓練流程、安全性和廠房操作員的效率都得以改善。
飲料公司Anheuser-Busch InBev面對技能升級需求,以及資深員工紛紛退休,選擇採用DeepHow平台將標準作業程序轉換為簡單易懂的視覺化指引。這個平台將職前訓練時間縮短80%,不僅大幅提高訓練的一致性,更改善了員工長期的學習成效。
Milestone Systems提供全球最大規模、專門用於管理複雜工業與城市部署中的IP影音感測器資料的平台,正透過旗下平台Project Hafnia ,打造全球最大的真實世界電腦視覺資料庫。該平台功能豐富,能讓物理AI開發者取用自訂的視覺語言模型( VLM)。Milestone Systems運用NVIDIA NeMo Curator,打造了專為智慧交通運輸系統調整的視覺語言模型,可用於影片搜尋與摘要藍圖,協助開發能更妥善管理市區道路的AI代理。此外,Milestone Systems還打算將全新的開放式可自訂NVIDIA Cosmos Reason視覺語言模型用於物理AI。
物聯網公司Telit Cinterion已將NVIDIA TAO Toolkit 6整合至旗下的AI視覺檢查平台。該平台使用FoundationPose這類視覺基礎模型搭配NVIDIA模型,不僅支援多模態AI,更提供了高效能的推理能力。TAO將低程式碼AI功能整合至Telit平台,讓製造商能為偵測瑕疵和品質控制,快速開發及部署準確的自訂AI模型。
NVIDIA Metropolis的5項物理AI更新:NVIDIA Metropolis的關鍵更新,強化了開發者更輕鬆快速打造物理AI應用的能力:
Cosmos Reason VLM
最新版Cosmos Reason是NVIDIA適用於物理AI的先進、開放、可自訂、並擁有70億個參數的視覺語言模型,可支援Metropolis應用案例中的情境化影片理解與時間事件推理。其精巧的大小便於從邊緣到雲端的部署,非常適合自動化交通監控、公共安全、視覺檢測與智慧決策。
VSS Blueprint 2.4
VSS 2.4可透過Cosmos Reason輕鬆快速擴充現有的視覺AI應用,為智慧型基礎設施提供強大的新功能。該藍圖的應用程式介面進一步擴充,讓使用者可更直接且彈性選擇特定的VSS元件與功能,以生成式AI強化電腦視覺流程。
全新的視覺基礎模型
NVIDIA TAO Toolkit包含一套全新的視覺基礎模型,以及整合先進的微調方法、自我監督式學習與知識蒸餾功能,可最佳化在邊緣與雲端環境部署物理AI解決方案的作業。NVIDIA DeepStream SDK包含全新的Inference Builder,可順暢整合TAO 6模型。
Advex AI、Instrumental AI與Spingence等世界各地的公司,正運用這些新模型和NVIDIA TAO,打造能將工業營運最佳化並提高效率的智慧解決方案。
NVIDIA Isaac Sim 擴充套件
NVIDIA Isaac Sim參考應用的全新擴充套件,有助於解決視覺AI開發常見的難題,例如標籤資料有限與罕見的極端案例。這些工具模擬人機互動、生成豐富的物件偵測資料集,並且為訓練視覺語言模型建立以事件為基礎的場景以及圖像與說明文字配對,加快開發速度,並且提高AI在實際應用情境的效能。
更豐富的硬體支援
這些Metropolis元件現在可在NVIDIA RTX PRO 6000 Blackwell GPU、NVIDIA DGX Spark桌上型超級電腦,以及物理AI與人形機器人技術適用的NVIDIA Jetson Thor平台執行,讓使用者能夠在邊緣到雲端的環境開發及部署。
Cosmos Reason 1與NVIDIA TAO 6.0現已開放下載。立即註冊,即可在VSS 2.4、Cosmos Reason VLM微調更新與NVIDIA DeepStream 8.0推出時收到通知。