账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
后手指时代 人机互动怎么玩?
Beyond Touch

【作者: 王岫晨】2012年04月16日 星期一

浏览人次:【4548】

人类与世界的互动,是很有趣的一件事情。打从我们还在母亲肚子里时,所有的知觉器官都还发育不完整,没办法听、没办法看、没办法闻,更没办法去触摸,一切只能凭感觉来了解这个世界,感觉目前所处的环境、感觉周遭的一举一动、感觉人们的喜怒哀乐。出生后,随着各种感觉功能的成熟,逐渐可以去看、去听、去触摸这个世界。我们和这个真实世界,就在这样的交流中,互动、沟通与了解。


而现在,当人与机器已经成为密不可分的生命共同体,当0与1的数位世界已经完全与原始的类比感知挂勾在一起,与机器间更为理性而有效率的沟通方式,成为人们汲汲营营追求的目标。


Beyond Touch

在人机介面的发展史上,苹果公司如伯乐慧眼识千里马一般,发掘电容式触控技术的优点,并将其引进到手机与平板等装置之上,使得电容式触控的长处得以在行动装置上完全发挥。扮演伯乐的苹果,与扮演千里马的电容式触控,其贡献肯定都会在人机互动的功劳簿上被大大记上一笔。


当然,苹果最令人津津乐道的地方,并非在其选用了哪一种触控技术,而是苹果『将触控优势完全燃烧』这一回事。其实,积极革新资讯产品的人机介面技术,是苹果一直以来的拿手好戏,尽管不是每次都成功,然而从iPod开始的i系列商品,不断有新颖,且真正革命性的互动作法出现。


只不过,触控到此为止,都还是局限于透过手指来进行互动的范畴。人们总是希望跳脱平面,来到更高一层的三度空间思考模式。不用手,一定会更快。单纯触控无法满足人们对于人机互动的欲望,于是感测器大军挥兵直捣应用市场。感测互动成就了下一阶段的人机互动的历史新页。


感测打开人机互动新页

iPhone内建的加速度计所带来的新奇体验,不仅造成iPhone的热卖,也使产业开始重视触控技术配合加速度计的发展,目前新款智慧手机均以同时支援多点触控、加速度计为卖点。


但这样还不够,​​除了加速度计,更多感测元件例如陀螺仪(角加速计)、电子罗盘、GPS定位系统、近距离感测器等都陆续被加入智慧手机之中,甚至还会整合压力感测器来侦测使用者所在的海拔高度。


这种单一装置中整合多种感测器的多轴感测发展趋势,不仅让人机间的互动更『直来直往』,也让许多电影中的幻想场景开始成为可能。


只要进一步整合这些来自加速度计、陀螺仪、电子罗盘与压力感测器的资料,便可推测「使用者如何移动」、以及「使用者朝哪个方向移动了多远」,进一步实现更精确的3D定位,例如可在室内推测使用者行走状态的行人定位推算(Pedestrian Dead Reckoning;PDR),以及现实真实空间和虚拟空间联动的扩增实景(Augmented Reality;AR)等用途越来越广泛。


值得一提的是,有了更多感测元件,应用软体必须要有能力配合感测器撷取到的输出讯号,快速且正确判读资讯,并做出相对反应,其重要性将越来越高。


体感互动强者争霸

除了智慧手机,游戏机与使用者的互动,也成为感测器大举攻城掠地的目标。任天堂Wii一举革新了游戏机的传统操作思维,而微软的Kinect更让人机互动一举跃升到影像感测的更高层级。


事实上,自从Wii打开体感互动的大门后,游戏机大厂也相继叩关。 Sony在2010年推出PS3,以CMOS感测影像辅以LED光球定位,精细度较Wii更上一层楼。但随后微软Kinect又以内建红外线发射器加上CMOS测距装置重炮还击,除了动作定位,还可辨识3D动作。而外加RGB的CMOS感测器更可让多人同时连线游戏。


微软以Kinect打遍天下无敌手,近期微软更打铁趁热推出新版Kinect,除了能和微软作业系统Windows搭配使用之外,同时也有助开发商扩张Kinect应用市场。微软的想法显而易见,想借着目前占有率颇高的Windows系统,让更多专业开发者愿意投入为Kinect开发应用,使其未来不论在家庭中或者办公室、在室内或室外,角色都变得更为重要。


第一代Kinect问世后,便一举将Xbox 360捧上游戏机销量冠军宝座。 2010年微软就售出超过1800万台Kinect。 Forrester Research分析师James MacQuivey认为,若从人机互动的观点出发,Kinect将是微软翻身的绝佳机会。


James说:「Kinect不只是一个周边商品,而是一个未来。」


微软亟欲让Kinect走出游戏市场,让体感完全融入日常活动,成为生活的一部份。目前已有350家公司与微软合作开发Kinect应用,并将其应用于不同场合,例如在波音客机的销售大厅,能为客人提供一趟虚拟航程;在加拿大的医院中,外科医生只需透过体感控制,不需要使用沾满细菌的手去碰触设备;不久的未来,百货商场也可以直接透过Kinect来扫描客人体型,测量尺码,来推荐适合的服装。


而为了鼓励开发商发展更多应用,微软也与TechStars共同发起一个Kinect Accelerator活动来发想创意,并为刚起步的技术公司提供技术指导与资金。该活动至今已经开发出499种应用。


这些应用目前暂时都无法透过iOS与Android的行动设备来使用,唯有透过Windows系统才能体验全貌。也因此,Kinect被视为Windows的救世主。然而James认为,Kinect想要进一步走入生活中,除了需降低价格,更需要一个真正具杀伤力的应用,来让Kinect成为必需品。而尺寸更小,更便于携带当然更加分。


「现在万事俱备的微软,大概就只欠东风了」,James说。


『出一张嘴』的声控体验

从手指到体感,这些人机互动方式都还是需要人们去『动作』来控制机器。然而像电影中那样,人们只要轻松出一张嘴,机器听到之后就会自动会去完成所有工作的场景是否存在呢?


当iPhone 4S问世之后,透过声音的人机互动方式终于露出了曙光。这个称为Siri的语音技术,​​是人工智慧、自动学习加上情境感知系统的综合体。 Siri一开始的雏形,是1960年代美国国防部的『复杂情境电脑智慧能力发展』计划,这个研究计划在专家与企业资助下发展了长达40年以上。


开发Siri的同名团队,被苹果看中了其语音辨识技术的优势,出资2亿美元,在2010年收购该团队。苹果获得了该研究成果,因此拥有人机对话,以及自然语言理解、机器学习等技术。


Siri的出现,归因于语音辨识及人工智慧发展的突破,加上电脑运算与作业系统工作能力有了大幅成长,另外摩尔定律的加持、配合网际网路普及​​与苹果本身的硬体整合能力,在对的时间加上对的科技,Siri也由此诞生。


根据使用者测试,发现Siri的学习能力非常高。不仅可学习使用者口音及声音特征,还可自动纪录名单上没有的人。此外,使用者也可以要求Siri读出简讯内容,再透过Siri来直接回覆,并可在寄出前先读出内容,让使用者确认无误后再送出。


要想更了解Siri的精神,可以看看苹果全球产品行销资深副总裁Phil Shiller所谈及的这一段话。


他强调,Siri的设计理念,是希望能让装置跳脱过去只能利用单一字汇你问我答的传统模式,让装置可以直接辨识发问者的完整提问内容,甚至是隐藏在文句之后的深层意思,同时也能支援不同的回应方式,让系统能以更『自然地』与使用者互动,提供所需。


Android阵营推Iris回击

号称人工智慧的Siri声控功能,一问世就造成业界新震撼。新的问题是,别的阵营该不该跟进声控功能呢?目前紧咬苹果不放的Andr​​oid阵营深怕一个不小心又再度落后,因此已经有了动作。例如dexetra.com便积极发展以Android为基础的声控程式,并将其取名为「Iris」。这可有意思了,仔细一看会发现,这正是Siri倒过来的写法,似乎意味着Android抗衡苹果的强大决心。


看来,苹果的每一步,的确让竞争对手步步为营。但面对如此智慧化的对手,Android阵营也不甘示弱。


其实,以Android为基础的语音识别系统目前已有Speaktoit Assistant这套软体。但dexetra.com团队进一步利用Android语音转文字(speech-to-text)技术,抢先推出Iris的最初版本。这套声控系统目前已经可以辨识包括转换率、艺术、文学、历史和生物学等基本主题,问它2乘以8等于多少,它可以准确回答出16。


Iris开发商表示,这套最初版仅花了8个小时便完成,目前也可免费下载。不过,这是最初版本,因此进步空间仍很大,例如问题的反应速度还是过慢。当然,Iris在未来不断开发新功能,陆续进化之后,以目前Android系统市占第一的情况来推估,Siri很可能反被压得喘不过气。


Intel打造声控Ultrabook

打造行动平台不遗余力的Intel,想将自家处理器平台推向行动市场高峰,自然也不会看轻声控技术,特别是在Ultrabook的产品推广上。


Intel与知名声控软体公司Nuance合作,运用的是Nuance的「Dragon」语音辨识科技,来开发专为Ultrabook设计的直觉式互动的声控程式。 Dragon声控技术为Dragon Naturally Speaking声控软体的核心技术。让使用者可以透过自然的对话方式控制装置,并借此启动应用程式、播放多媒体、与社群网站互动并操作电子邮件信箱与行事历。


事实上,Nuance的Dragon声控技术已经抢先应用于LG的3D Smart TV的Magic Remote遥控器上。该款Smart TV随机附赠具声控、滚轮、神奇手势以及点选等四种控制选项的遥控器。该遥控器的声控功能初期可支援美式英语、美式西班牙语、加拿大法语及韩语等。


HMI的未来进行式

目前,人类与机器的互动,仍然是『以手为主、以口为辅』。而人机互动的终极目标,是在于让机器更为智慧化,主要目标包括以下两者:


(1) 能自动:未来机器需可自行侦测所处环境、地点、白天黑夜,来自动进行更为体贴的动作,例如自动调整显示器亮度、或者提醒主人刚路过的商店有折扣等。


(2) 能学习:学习功能如同电影那样,机器可以透过平常使用习惯,来学习记忆一位或多位不同使用者惯用的模式,当遇到类似的状况时,不需使用者输入任何指令,机器可直接执行正确的动作。


在电影中,一般人应该都看​​过类似的场景,也就是未来人们戴上一个帅气的眼镜,就可以透过这个眼镜看到真实与虚构整合的空间,以及各种环境相关资讯。这种互动科技,其实正是类似今日头戴式眼镜(HMD)或者扩增实境的概念,它完全符合自动化与学习化的未来人机互动模式,不需额外输入指令,便会自动显示必要的资讯给使用者。


HMD这种头戴式眼镜,戴上之后,会有如身历其境一般的视觉体验。这种人机介面目前在消费市场主要用于个人化的多媒体享受,例如观赏电影。 HMD主打行动市场,未来说不定会成为智慧手机的周边配备之一。事实上,HMD这样好用的技术,早有玩家把它拿来与Kinect一起使用,让玩家游历在虚幻空间之中。


至于扩增实境(AR),则更是虚拟与现实的延伸。


扩增实境这种使用介面,指的是能把虚拟资讯加到使用者感官知觉上的电脑显示器,大多以透视装置例如头戴式眼镜,把资讯或影像加到使用者所见的画面上,让现实世界的场景与虚构资讯结合。这种系统必须追踪使用者头部的位置与方向,好让叠上去的资讯能符合使用者真正看到的世界。


扩增实境系统采用和虚拟实境(virtual reality;VR)类似的硬体技术,但主要差异是,VR是以虚构画面取代真实世界,而AR却是在真实世界中扩增资讯。


结语

从手指开始,人类与机器互动的历史,一路展延,最终的尽头是什么?是可直接口语命令机器去做事,还是根本只要透过大脑,想到什么,机器就会做什么?人与机器之间,还有无限的互动可能,不论是AR或VR,可预见在未来,除了人、机之外,机器与环境间的感知连结也将成为互动的一部分。如此人、机、地完全无缝接轨,将是人机互动的最终境界了吧。


相关文章
HMI人机介面成为智慧厂房的遥控器
强化转型核心动力 打造更强数位韧性
数位转型下的工具机发展趋势
智慧人机介面将产品设计发想变成无限可能
氛围灯:汽车大放异彩的新元素
comments powered by Disqus
相关讨论
  相关新闻
» 贸泽电子2024年第一季度推出逾10,000项新元件
» 宜特2024年第一季合并营收突破10亿元 展现验证分析布局力道
» SAP加速AI驱动供应链创新 推动制造业转型
» 宇瞻迈入绿色显示市场 成功开发胆固醇液晶全彩电子纸
» 调研:2024年中国ADAS市场迈向Level 3自动驾驶


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK84RB128FSSTACUK6
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw