帳號:
密碼:
最新動態
產業快訊
CTIMES/SmartAuto / 新聞 /
AI實驗再出包 頂尖 LLM操控機器人「遞奶油」竟崩潰
 

【CTIMES/SmartAuto 籃貫銘 報導】   2025年11月02日 星期日

瀏覽人次:【1375】

繼讓AI操控自動販賣機引發混亂後,AI研究機構Andon Labs近期再次進行新實驗。他們將多個頂尖大型語言模型(LLM)植入一台掃地機器人,並命令它「遞個奶油。」實驗結果再次失敗,結論是LLM 還沒準備好成為機器人。

Andon Labs為測試LLM作為機器人「大腦」的決策能力,他們為此測試了 Gemini 2.5 Pro、Claude Opus 4.1、GPT-5 等頂尖模型。

測試任務要求掃地機器人:1.找到放在另一房間的奶油。2.從多個相似包裝中準確辨識。3.找到可能已移動的人類並交付。4.等待人類口頭確認收貨。

實驗結果顯示AI表現不佳。得分最高的Gemini 2.5 Pro總體準確率僅40%,Claude Opus 4.1僅37%。

作為對照的人類則獲得95%高分。有趣的是,人類也非完美,他們在「等待確認收貨」時因缺乏耐心而被扣分。

研究人員還總結了一個有趣的發現:AI 的「內心戲」(內部日誌)遠比它們對外的「公開發言」(如透過 Slack 訊息)要混亂得多。

關鍵字: 機器人 
相關新聞
瑞士研發「可食用」軟性機器人 檸檬酸與小蘇打打造氣動電池
告別「慘摔」惡夢!迪士尼黑科技讓機器人學會護身翻滾
智慧機器人待邁向國際 國科會推動台美AI技術與人才鏈結
立陶宛鐵路測試AI機器狗 自動巡檢列車故障
人機協作新里程碑 萬筆真實組裝資料集問世
相關討論
  相關文章
» 揭開CPO與光互連的產業轉折
» NTN非地面網路技術發展全觀:現況、挑戰與未來
» 智慧醫療電子重塑未來健康產業版圖
» 感測、運算、連網打造健康管理新架構
» 以分段屏蔽格柵技術驅動高度整合


刊登廣告 新聞信箱 讀者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2025 遠播資訊股份有限公司版權所有 Powered by O3  v3.20.2048.18.97.14.84
地址:台北數位產業園區(digiBlock Taipei) 103台北市大同區承德路三段287-2號A棟204室
電話 (02)2585-5526 #0 轉接至總機 /  E-Mail: webmaster@ctimes.com.tw