CTIMES/SmartAuto - AI实验再出包顶尖 LLM操控机器人「递奶油」竟崩溃:机器人

│新东西市集│东西讲座│影音频道│出版中心│

元件次系统自动控制

最新动态

产业快讯

CTIMES/SmartAuto / 新闻 /

AI实验再出包顶尖 LLM操控机器人「递奶油」竟崩溃

【CTIMES / SMARTAUTO ABC_1 报导】 2025年11月02日星期日

浏览人次：【2127】

继让AI操控自动贩卖机引发混乱後，AI研究机构Andon Labs近期再次进行新实验。他们将多个顶尖大型语言模型（LLM）植入一台扫地机器人，并命令它「递个奶油。」实验结果再次失败，结论是LLM 还没准备好成为机器人。

Andon Labs为测试LLM作为机器人「大脑」的决策能力，他们为此测试了 Gemini 2.5 Pro、Claude Opus 4.1、GPT-5 等顶尖模型。

测试任务要求扫地机器人：1.找到放在另一房间的奶油。2.从多个相似包装中准确辨识。3.找到可能已移动的人类并交付。4.等待人类囗头确认收货。

实验结果显示AI表现不隹。得分最高的Gemini 2.5 Pro总体准确率仅40%，Claude Opus 4.1仅37%。

作为对照的人类则获得95%高分。有趣的是，人类也非完美，他们在「等待确认收货」时因缺乏耐心而被扣分。

研究人员还总结了一个有趣的发现：AI 的「内心戏」（内部日志）远比它们对外的「公开发言」（如透过 Slack 讯息）要混乱得多。

關鍵字：机器人

相关新闻

‧	中钢带头汇聚产学研能量助攻机器人动力系统供应链
‧	日本航空启动人形机器人试验对抗高龄化引发的机场劳动力荒
‧	2026汉诺威工业展闭幕生成式AI与人形机器人成亮点
‧	研华打造Edge AI关键基础建设引领Physical AI渗透产业场域
‧	现代汽车与DEEPX结盟发表次世代实体AI运算平台

相关讨论

相关文章

»	[COMPUTEX] 迎向全新30年：USB技术从混乱走向无处不在
»	建兴储存Computex 2026扩大浸没式冷却SSD布局应对AI资料中心散热
»	挥手即控制！新唐科技推出 NuMaker-GestureAI-M55M1 赋予终端设备智慧手势控制能力
»	基於dsPIC33A DSC的小型感测器/致动器ECU搭配MICROSAR IO示范应用程式
»	应用材料公司宣布博通公司成为 EPIC 创新合作夥伴

｜

｜

｜

著作權聲明

｜

隱私權聲明

｜

｜

	︱	Copyright ©1999-2026 远播信息股份有限公司版权所有 Powered by O3 v3.20.1.HKA67AV33GMSTACUK0
		地址:台北数位产业园区（digiBlock Taipei） 103台北市大同区承德路三段287-2号A栋204室电话 (02)2585-5526 #0 转接至总机 / E-Mail: webmaster@ctimes.com.tw