MCPLive > 杂志文章 > 感知计算 平静之下隐藏的暗流涌动

感知计算 平静之下隐藏的暗流涌动

2013-06-08徐晶《微型计算机》2013年6月上

未来人与智能终端的交互模式究竟是怎样的形态?为了尝试获得答案,业内无数先驱不断努力。比如,我们有挥手、扭动身体就可以玩的游戏机,有通过触摸控制的平板电脑,还有可以回答你问题的语音助手……感知计算,一种以直观简单、自然并且身临其境的操作模式为目的的计算方式,正在受人追捧。新的战争已经悄悄打响了吗?

感知计算 平静之下隐藏的暗流涌动

Ni=你 英特尔的布局

IDF 2013,英特尔高级副总裁邓慕理站在演讲台中央,他没有控制任何机器,先是大喊“我们一起来听《We Will Rock You》”。场下的观众被这突如其来的事情搞得摸不着头脑——这不是IDF会场吗?

为什么要放劲爆的音乐?紧接着,台上的邓慕理好像明白了什么,大喊着说:“我知道你们更熟悉中国歌曲,好,来一曲《炫民族风》”。随后节奏感极强的旋律响起:“苍茫的天涯是我的爱,绵绵的青山脚下花正开……”

邓慕理想演示的其实是人们未来生活中的常见场景:告诉电脑,我要听《We Will Rock You》,于是电脑找到了这首歌曲并播放出来。告诉电脑换一首,换成《炫民族风》,电脑又做到了,没有手动操作。用声音告诉电脑自己所需,电脑处理识别后,自动开始工作。邓慕理的所作所为,并非仅仅为了引发观众热情,而是在用实际行动告诉观众,我们可以用一种全新的手段和电脑进行交流。这种交流叫做感知计算。这种计算方式,更直接,更自然。

英特尔在IDF展示了基于双摄像头的3D动作识别技术,可以通过手势与画面中的小猴子交流,还可以玩石头剪子布。
英特尔在IDF展示了基于双摄像头的3D动作识别技术,可以通过手势与画面中的小猴子交流,还可以玩石头剪子布。

邓慕理展示了一个公式:Ni=你。左侧的Ni分别是英文单词Natural自然、Intuitive直观或者Immersive身临其境,它们的首字母可以组成了Ni——汉语拼音“你”,恰好等于右侧。“人出生的时候,手上没有拿着键盘和鼠标,而感知计算就是要让人和电脑自然地沟通。用你的手,用你的嘴,用你的眼神,而不是键盘和鼠标。”邓慕理这样描述着他心中理想,这也代表了英特尔正在开始准备的未来方向——感知计算。

英特尔不只是一个硬件厂商,虽然之前在PC领域的优势让大家通常如此认为。PC普及之后带来的增长停滞同样也影响着英特尔。对于目前新兴的手机、平板移动计算市场来说,英特尔仍然处于刚进入的阶段,能否顺利击败庞大的竞争对手——ARM阵营,还有待时间验证。现在英特尔需要新的话题来刺激用户,获得关注。英特尔也许看到了未来,只有更加直接与简单的应用才能真正留住消费者。于是,以语音控制、手势控制等为代表的感知计算成为英特尔的重要方向。

以Nuance技术为背景的语音交流技术已经全面进入Windows、iOS与Android,共同合作让各个平台体验趋于一致。

以Nuance技术为背景的语音交流技术已经全面进入Windows、iOS与Android,共同合作让各个平台体验趋于一致。
以Nuance技术为背景的语音交流技术已经全面进入Windows、iOS与Android,共同合作让各个平台体验趋于一致。

有一点令人颇感意外,英特尔展示的,被称作Dragon Assistant的语音助理软件技术来自于和Nuance的合作。Nuance正是苹果Siri的后台技术公司,而Dragon Assistant也同样支持中文,中文部分由科大讯飞提供技术支持。英特尔表示Dragon Assistant能够充分应用酷睿处理器的计算能力,让用户在诸如搜索、视频播放、更新微博等应用中全部使用语音控制。

看来对于感知技术的研发来说,专门针对其研究的公司也许更有话语权,未来科技公司之间的合作可能会成为主流,硬件公司会在软件开发过程中加入针对硬件架构的优化,利用好硬件的计算能力。

Kinect上市后,吸引了大量的用户,甚至很多用户为了体验Kinect而购买XBOX360。
Kinect上市后,吸引了大量的用户,甚至很多用户为了体验Kinect而购买XBOX360。

除此之外,面部识别技术是英特尔的另一个秘密武器。英特尔称之为Fast Access Any where,希望它可以代替传统的密码来控制诸如用户网站权限甚至银行账户等应用。此外,英特尔还在动作识别上面有所建树,通过高品质的双摄像头将摄录的画面3D化,然后由CPU来处理与计算,对用户的手势操作进行判断,实现无需触控,即可虚拟操作。这有些类似于微软的Kinect,但在识别的距离等方面有不同,它更贴合普通用户的近距离环境,更接近于电影中我们看到的场景。

英特尔在IDF上对感知计算表现出了极大的兴趣。不但发布了全套的感知计算软件,开始着手建立整个感知计算软件和硬件平台,而且还设立了总奖金一百万美元的“英特尔感知计算挑战赛”(Intel Perceptual Computing Challenge),邀请全球的开发者使用英特尔发布的感知计算套件来实现各种感知计算应用。的确,如果英特尔能够成功地让感知计算的应用附着在自己的硬件平台上,那么不管未来的终端是不是PC,英特尔都能继续保持着行业领导者的地位。

Adobe的压感笔和电子尺子是感知计算应用的又一创新。
Adobe的压感笔和电子尺子是感知计算应用的又一创新。

触摸智能——苹果的开始

当然,感知计算并非是神奇的新事物。iPhone,其实就是苹果在感知计算领域进行的第一次革命。iPhone初代发售之前,触控技术其实大家都有,但灵敏性多数不佳,让人感觉很难用。直到苹果iPhone出世,才彻底改变了人们的看法,并进而让更多手机厂商迅速改进。苹果的高要求让触控变得极为自然舒适,而且用户能直接学会使用那些i OS上的新应用,似乎那些操作本来就应该这样。不仅如此,苹果还在大量软件和应用上引入了对动作的感知,比如双指放大图片、五指捏合关闭应用等设计,这都是让一切操作变得极为自然和轻松。

之前的人脸识别还不够智能,甚至照片都可以骗过系统。但随着3D摄像头的到来,人脸识别技术也在不断地优化。
之前的人脸识别还不够智能,甚至照片都可以骗过系统。但随着3D摄像头的到来,人脸识别技术也在不断地优化。

如果说界面和手势是苹果在感知计算上的第一次突破,那么Siri的推出,则被认为是苹果在感知计算领域重要的创新。从来没有这样一款软件能如此智能地回答用户的问题,并用自然语言和人交流。当然,现在的Siri其实并没有早期展示时那样神奇,当时甚至能猜出用户所想(这也许是由于用户量过于庞大、计算能力不足等原因, Siri的“智力”现在感觉有所降低),但这毕竟是一个可以和人交流的机器,不是背程序、不是冷冰冰的Yes和No,而是尽可能地交流—好吧,或许这只是高级一些的程序而已。即使如此,Siri也将感知计算的发展大大向前推动了一步。

因为人的思维一直被誉为人类后的秘密。Siri的出现,让很多人对这个突然到来的“机器朋友”充满好奇,很多人都在尝试它的底线究竟在哪里。不过后当人们发现Siri还是有很多无法回答的问题、拒绝回答等行为后,难免会有失望。但毕竟在大家心中埋下了一粒种子,存留了一丝希冀。这只是初代的感知计算。试想一下,当有一天你起床时,Siri告诉你今天需要做的事情,然后顺便说一句:“外面可能下雨,带伞,多加一件衣服,别感冒了”,自然(Natural)才真正实现,那才是真正的感知计算时代。曾经苹果掌握了这方面的一些精髓,所以苹果当时赢得很精彩。但在未来,苹果将如何发展还是秘密,iWatch能带来什么?目前一切还不清晰。

动作——微软的多眼机器

微软的Kinect当年堪称在感知计算技术上的重大突破。通过Kinect,玩家抛弃了键盘和鼠标,站在屏幕前做出各种动作玩游戏。与此类似的场景是之前Wii的游戏手柄。加入了重力感应、方向感应和加速度感应的Wii手柄,能做出很多自然的动作,比如打高尔夫就是拿着手柄抛起,打鼓就是用手柄虚拟敲鼓。但Kinect更直接一步,通过摄像头观察、定位用户,不需要你拿着手柄挥来挥去。打球就是挥手,甚至切水果这样的游戏,都能通过Kinect并指成刀,切个不亦乐乎。

微软一直试图在感知计算上更进一步,但目前除了Kinect外,并没有更多成功的案例。感知计算作为一个刚起步的行业,可以做的事情还有很多,微软也有很多机会。在一份微软发布的,对未来世界的畅想视频中,墙壁上、玻璃上、冰箱上甚至是你的手套、眼镜上,人们都能通过对各种操作窗口的点击,获得所需要的信息。早上起床后,闹钟会告诉你天气、议程以及你的身体状况,用户可以随意查阅今天的重要新闻,所有的内容都已经分类并根据用户阅读习惯排列。虽然目前这只是微软的创意,但展示了未来感知计算世界的雏形。

所以,虽然短期内微软并没有大张旗鼓进军感知计算的动向,但可以肯定的是,微软会将继续把Kinec t发扬光大,全新一代XBOX中更多有关体感游戏的内容是可以预期的。未来甚至Kinect和新一代的Windows结合也极有可能,让用户在电脑面前动动手就可以完成操作。微软肯定看到了感知计算的未来,利用直接和自然的操作来控制Windows,大方向应该不会变。

群雄并起——感知计算大潮来袭

在感知计算的大潮来袭时,三星自然也不会漠视。一系列的Galaxy手机不但有安卓系统所拥有触控感知特性,还自己创造了很多新的技术。比如三星手机可以通过感知用户是否在看屏幕,来决定屏幕亮度或开关。这样用户在手机上阅读电子书时就不用不停地按屏幕以保持屏幕常亮,还有包括用户在短信界面将手机贴面,手机就会直接拨打电话等新功能。这都可以算是目前感知计算的经典之作。

这些还不够。一些消息表明,英特尔、高通和三星同时看上了位于以色列的手势识别公司Omek,这家公司的产品可以根据用户不同的手部动作,操作电脑实现不同的任务,包括在近距离精确识别精细的手指动作等。这三家行业巨头纷纷竞价,打算买入这家公司来获取技术优势。而谷歌的Google Glass希望戴着眼镜就能完成操作,让眼球也能成为控制中心。Adobe的Project Mighty压感笔和Napoleon电子尺虽然目前定位于专业用户,不过其中所包含的感知技术显然也是独具魅力的。

除了巨头们,一些小型公司也在感知计算上不懈地努力。比如Thalmic Labs推出的MYO腕带利用肌肉感知你的动作,并操作电脑;Leap Motion(Omek的竞争对手)也推出了大量基于手势的感知计算软件。国内科大讯飞的语音识别系统,也开发出了类似Siri的智能语音助手,也能实现一些简单的操作和查询工作。这些小公司在感知计算上的能量肯定不如英特尔、微软、苹果、三星这样的巨头,但毫无疑问的是,数量巨大的小公司会开发出大量的感知计算产品,即使按照概率来算,一百个感知计算应用有一个成功,未来都会十分精彩。

继续储备——感知计算的未来之路

如果仔细观察整个人类工具进化的过程就会发现,所有生活工具的使用难度一般都是从困难到容易,从少数人的专利到普罗大众都可以使用。工具在进化的过程中变得越来越简单、自然、直接。

计算机的发展也是这样。早期的计算机使用极为麻烦,纸带、磁带等设备用起来并不容易。在显示器出现后,更直观的显示让计算机发展变得迅速。随后的图形化操作系统、平板电脑、智能手机的出现,让计算开始呈现无处不在的特点。不过,改变是需要时间的。举例来说,语音识别软件IBM VIA VOICE从上个世纪90年代就开始在PC上推出,但直到今天语音识别与控制才算是略有小成,除了技术本身优化以外,显然计算处理能力的提升也是促使技术成熟的关键。

目前的感知计算还有很多阻碍普及的问题。比如识别不够精准、不够智能化,这些问题终都是需要更强大的计算能力和感应能力来解决。这个计算也许并不只是在PC或者笔记本电脑上,甚至连平板和手机都不止,也许未来在服饰、眼镜、手表等各种穿戴设备上都会需要强大的计算能力。

当然,终推动感知计算迅速发展的应该还是消费电子类产品,毕竟对于服饰来说,装饰与美观是主要的需要,要改变人们的思想去追求智能化并不容易。但人们在消费电子上的需求则是功能够酷够好用,预算总是充足的。因此相信未来还是会从这里开始普及,并侵入到更广泛的领域中去,比如运动装备、家庭医疗设备等。

目前感知计算领域处于技术爆发前夜的安静。人们已经看到了不少改变了生活的感知计算应用,但对感知计算本身的潜力和蕴含的真正能量来说,这还只是冰山一角。在这样的时间点,业界涌动的是暗流,是安静的“圈地”行为。就像RTS游戏的初期阶段那样,各种科技的研发,计算技术、节能技术的储备才是IT厂商们目前紧锣密鼓准备的重点,到未来感知计算在我们生活中爆发的时间节点,谁能引领风骚才会有答案。

分享到:

用户评论

用户名:

密码: