CTIMES/SmartAuto - AI實驗再出包頂尖 LLM操控機器人「遞奶油」竟崩潰:機器人

│新東西市集│東西講座│影音頻道│出版中心│

元件次系統自動控制

最新動態

產業快訊

CTIMES/SmartAuto / 新聞 /

AI實驗再出包頂尖 LLM操控機器人「遞奶油」竟崩潰

【CTIMES/SmartAuto 籃貫銘報導】 2025年11月02日星期日

瀏覽人次：【2126】

繼讓AI操控自動販賣機引發混亂後，AI研究機構Andon Labs近期再次進行新實驗。他們將多個頂尖大型語言模型（LLM）植入一台掃地機器人，並命令它「遞個奶油。」實驗結果再次失敗，結論是LLM 還沒準備好成為機器人。

Andon Labs為測試LLM作為機器人「大腦」的決策能力，他們為此測試了 Gemini 2.5 Pro、Claude Opus 4.1、GPT-5 等頂尖模型。

測試任務要求掃地機器人：1.找到放在另一房間的奶油。2.從多個相似包裝中準確辨識。3.找到可能已移動的人類並交付。4.等待人類口頭確認收貨。

實驗結果顯示AI表現不佳。得分最高的Gemini 2.5 Pro總體準確率僅40%，Claude Opus 4.1僅37%。

作為對照的人類則獲得95%高分。有趣的是，人類也非完美，他們在「等待確認收貨」時因缺乏耐心而被扣分。

研究人員還總結了一個有趣的發現：AI 的「內心戲」（內部日誌）遠比它們對外的「公開發言」（如透過 Slack 訊息）要混亂得多。

關鍵字：機器人

相關新聞

‧	中鋼帶頭匯聚產學研能量助攻機器人動力系統供應鏈
‧	日本航空啟動人形機器人試驗對抗高齡化引發的機場勞動力荒
‧	2026漢諾威工業展閉幕生成式AI與人形機器人成亮點
‧	研華打造Edge AI關鍵基礎建設引領實體AI滲透產業場域
‧	現代汽車與DEEPX結盟發表次世代實體AI運算平台

相關討論

相關文章

»	[COMPUTEX] 迎向全新30年：USB技術從混亂走向無處不在
»	建興儲存Computex 2026擴大浸沒式冷卻SSD佈局應對AI資料中心散熱
»	揮手即控制！新唐科技推出 NuMaker-GestureAI-M55M1 賦予終端設備智慧手勢控制能力
»	基於dsPIC33A DSC的小型感測器/致動器ECU搭配MICROSAR IO示範應用程式
»	應用材料公司宣布博通公司成為 EPIC 創新合作夥伴

｜

｜

｜

著作權聲明

｜

隱私權聲明

｜

｜

	︱	Copyright ©1999-2026 遠播資訊股份有限公司版權所有 Powered by O3 v3.20.1.HKA67A724V6STACUKD
		地址:台北數位產業園區（digiBlock Taipei） 103台北市大同區承德路三段287-2號A棟204室電話 (02)2585-5526 #0 轉接至總機 / E-Mail: webmaster@ctimes.com.tw