账号:
密码:
最新动态
 
产业快讯
 
CTIMES/SmartAuto / 新闻 /
AI实验再出包 顶尖 LLM操控机器人「递奶油」竟崩溃
 

【CTIMES / SMARTAUTO ABC_1 报导】    2025年11月02日 星期日

浏览人次:【2127】

继让AI操控自动贩卖机引发混乱後,AI研究机构Andon Labs近期再次进行新实验。他们将多个顶尖大型语言模型(LLM)植入一台扫地机器人,并命令它「递个奶油。」实验结果再次失败,结论是LLM 还没准备好成为机器人。

Andon Labs为测试LLM作为机器人「大脑」的决策能力,他们为此测试了 Gemini 2.5 Pro、Claude Opus 4.1、GPT-5 等顶尖模型。

测试任务要求扫地机器人:1.找到放在另一房间的奶油。2.从多个相似包装中准确辨识。3.找到可能已移动的人类并交付。4.等待人类囗头确认收货。

实验结果显示AI表现不隹。得分最高的Gemini 2.5 Pro总体准确率仅40%,Claude Opus 4.1仅37%。

作为对照的人类则获得95%高分。有趣的是,人类也非完美,他们在「等待确认收货」时因缺乏耐心而被扣分。

研究人员还总结了一个有趣的发现:AI 的「内心戏」(内部日志)远比它们对外的「公开发言」(如透过 Slack 讯息)要混乱得多。

關鍵字: 机器人 
相关新闻
中钢带头汇聚产学研能量 助攻机器人动力系统供应链
日本航空启动人形机器人试验 对抗高龄化引发的机场劳动力荒
2026汉诺威工业展闭幕 生成式AI与人形机器人成亮点
研华打造Edge AI关键基础建设 引领Physical AI渗透产业场域
现代汽车与DEEPX结盟 发表次世代实体AI运算平台
相关讨论
  相关文章
» [COMPUTEX] 迎向全新30年:USB技术从混乱走向无处不在
» 建兴储存Computex 2026扩大浸没式冷却SSD布局 应对AI资料中心散热
» 挥手即控制!新唐科技推出 NuMaker-GestureAI-M55M1 赋予终端设备智慧手势控制能力
» 基於dsPIC33A DSC的小型感测器/致动器ECU搭配MICROSAR IO示范应用程式
» 应用材料公司宣布 博通公司成为 EPIC 创新合作夥伴


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2026 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HKA67AV33GMSTACUK0
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw