帳號:
密碼:
最新動態
 
產業快訊
 
CTIMES/SmartAuto / 新聞 /
AI實驗再出包 頂尖 LLM操控機器人「遞奶油」竟崩潰
 

【CTIMES/SmartAuto 籃貫銘 報導】   2025年11月02日 星期日

瀏覽人次:【2126】

繼讓AI操控自動販賣機引發混亂後,AI研究機構Andon Labs近期再次進行新實驗。他們將多個頂尖大型語言模型(LLM)植入一台掃地機器人,並命令它「遞個奶油。」實驗結果再次失敗,結論是LLM 還沒準備好成為機器人。

Andon Labs為測試LLM作為機器人「大腦」的決策能力,他們為此測試了 Gemini 2.5 Pro、Claude Opus 4.1、GPT-5 等頂尖模型。

測試任務要求掃地機器人:1.找到放在另一房間的奶油。2.從多個相似包裝中準確辨識。3.找到可能已移動的人類並交付。4.等待人類口頭確認收貨。

實驗結果顯示AI表現不佳。得分最高的Gemini 2.5 Pro總體準確率僅40%,Claude Opus 4.1僅37%。

作為對照的人類則獲得95%高分。有趣的是,人類也非完美,他們在「等待確認收貨」時因缺乏耐心而被扣分。

研究人員還總結了一個有趣的發現:AI 的「內心戲」(內部日誌)遠比它們對外的「公開發言」(如透過 Slack 訊息)要混亂得多。

關鍵字: 機器人 
相關新聞
中鋼帶頭匯聚產學研能量 助攻機器人動力系統供應鏈
日本航空啟動人形機器人試驗 對抗高齡化引發的機場勞動力荒
2026漢諾威工業展閉幕 生成式AI與人形機器人成亮點
研華打造Edge AI關鍵基礎建設 引領實體AI滲透產業場域
現代汽車與DEEPX結盟 發表次世代實體AI運算平台
相關討論
  相關文章
» [COMPUTEX] 迎向全新30年:USB技術從混亂走向無處不在
» 建興儲存Computex 2026擴大浸沒式冷卻SSD佈局 應對AI資料中心散熱
» 揮手即控制!新唐科技推出 NuMaker-GestureAI-M55M1 賦予終端設備智慧手勢控制能力
» 基於dsPIC33A DSC的小型感測器/致動器ECU搭配MICROSAR IO示範應用程式
» 應用材料公司宣布 博通公司成為 EPIC 創新合作夥伴


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2026 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.1.HKA67A724V6STACUKD
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw