富士通(Fujitsu)今日宣布開發出一項名為「空間世界模型(Spatial World Model)」的新技術,旨在讓機器人與人類之間的協作更輕鬆、安全且高效。該技術透過AI預測空間中不同主體與物體的未來行為及狀態,不僅能促進人機順暢協作,還能實現機器人間的最佳化協調。這是富士通在「實體AI(Physical AI)」領域研發的重要里程碑,該技術將於2026年1月6日至9日在拉斯維加斯舉行的CES 2026上首度公開展示。
隨著AI技術從數位空間延伸至實體場景,Physical AI被視為解決勞動力短缺與提升工業生產力的關鍵。然而,現有的應用主要侷限於工廠或物流倉庫等路徑固定的結構化環境。在家庭或辦公室等場所,人員移動難以預測且物體擺放頻繁變動,傳統AI難以即時評估空間動態,也無法理解他人動作背後的意圖,導致協作困難。
針對此痛點,富士通開發的空間世界模型技術採用「3D場景圖(3D scene graphs)」來構建空間模型。有別於傳統利用攝影機影像進行像素級整合的方式(容易受視角範圍差異與影像失真影響),新技術將實體空間中的所有物體組織為圖表上的節點與分層數據結構。這種方法能最小化視野範圍與鏡頭變形的影響,實現對複雜、動態變化的現實空間進行即時理解。
為了讓人類與機器人順利協作,機器人必須理解人類動作背後的意圖並預測其未來行為。目前的技術多僅能針對周遭環境進行建模,無法掌握整體空間的動態變化。
富士通的新方法透過解讀空間中人、機器人與物體間多樣化互動的因果關係,能準確估計行為意圖。根據學術公開基準數據測試,該技術在估計行為意圖的準確度上提升了3倍。系統利用這些數據預測未來動作,可有效避免碰撞,並為多個自主機器人生成最佳的協作行動計畫。
這項新技術整合了富士通在人流分析與異常行為檢測的電腦視覺技術,以及能自主執行任務的數位AI技術(如Fujitsu Kozuchi AI Agent)。這是該公司於2025年4月成立的空間機器人研究中心(Spatial Robotics Research Center)的研究成果之一,致力於實現人類與機器人共存的新社會。除了在CES 2026展出外,富士通也計畫於2026財年在其總部進行技術演示。