帳號:
密碼:
最新動態
 
產業快訊
CTIMES/SmartAuto / 新聞 /
數位雙生突破:SVII-3D技術利用稀疏街景實現分米級基礎設施定位
 

【CTIMES/SmartAuto 籃貫銘 報導】   2026年01月18日 星期日

瀏覽人次:【157】

中國武漢大學與四川省公路規劃勘察設計研究院的科研團隊聯合發表了名為「SVII-3D」的全新框架,成功解決了低成本街景圖像在三維定位上的精度難題。該技術透過先進的視覺語言模型(VLM)與幾何引導精鍊機制,能在稀疏影像中實現分米級(decimeter-level)的3D定位精度,並自動診斷設施的運行狀態。這項突破為大規模、低成本構建城市基礎設施數位雙生(Digital Twin)提供了高效的技術路徑。

在智慧城市與設施生命週期管理中,精確的資產數位化至關重要。傳統技術面臨兩難:光學雷達(LiDAR)系統雖然精準但成本極高;而基於圖像的傳統方法雖成本低廉,卻往往存在公尺級的定位誤差,且難以捕捉細粒度的狀態資訊。SVII-3D框架的出現,正是為了在低成本的稀疏影像基礎上,克服魯棒性不足、定位不準以及缺乏狀態識別能力的挑戰,從而實現高品質的自動化設施管理。

SVII-3D的核心技術之一在於結合了LoRA微調的開集檢測(Open-set detection)與空間注意力匹配網路。這種設計讓系統即使在觀測視角有限、圖像數據稀疏的情況下,也能強韌地關聯不同視角的觀察結果,準確識別目標物。這項技術有效解決了傳統方法在複雜城市環境中容易出現的誤報或漏報問題,大幅提升了物體識別的可靠性與完整性。

為了達到高精度的定位,SVII-3D引入了幾何引導精鍊機制(Geometry-guided refinement)。研究團隊透過雙向精鍊演算法,對未分配的觀測值進行合併與校正,確保每一件基礎設施的中心坐標都由幾何一致的光線集計算而得。實驗證明,即使在噪點較多且影像稀疏的情況下,該機制仍能確保定位準確度維持在釐米至分米級別,解決了資產普查中常見的重複計數與空間偏離問題。

除了幾何定位,SVII-3D更進一步整合了視覺語言模型(VLM)代理(如 Qwen-VL、GLM-4v 等),賦予系統自動診斷設施運行狀態的能力。透過注入國家標準的專家知識與檢索增強生成(RAG)技術,系統能精確區分結構性損壞與表面髒污,並以結構化的 JSON 格式輸出詳細的屬性與健康評估報告。這讓管理單位能依據實時數據判斷維護的優先順序,實現主動式、智慧化的養護策略。

目前 SVII-3D 框架已在武漢與上海等大城市數據集中通過測試,展現了卓越的擴展性與經濟效益。科研團隊表示,儘管依賴稀疏影像仍存在先天局限,但未來的研究重點將轉向開發具備自我驗證能力的「數位質量檢查員(Digital Quality Inspector)」,透過自動檢測感知失敗來提升普查系統的公信力。這項技術的成熟,將推動城市基礎設施從傳統人工巡檢徹底轉向全自動化的數位化管理範式。

相關新聞
數位雙生突破:SVII-3D技術利用稀疏街景實現分米級基礎設施定位
科技活化人文 VR技術讓福建土樓文化認知準確率達92%
從雲端走向雲地邊協同 偉康重塑製造AI決策
從晶片到人才競爭力 意法半導體蟬聯2026全球卓越雇主榜
台美完成15%對等關稅談判 獲不疊加與232最惠國待遇
相關討論
  相關文章
» AI PC時代來臨 NPU成為十年來最重要架構革命
» 半導體技術如何演進以支援太空產業
» MCU專案首選六大供應商排名暨競爭力分析
» 使用Microchip CEC1736 Trust Shield晶片作為AI伺服器信任根(RoT)
» 全頻段GNSS在高精度定位應用中的技術價值


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2026 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.1.HKA1I7VAXJASTACUKP
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw