中青在线版权与免责声明:
   在接受本网站服务之前,请务必仔细阅读下列条款并同意本声明。 1. 凡本网注明"来源:中青在线或中国青年报"的所有作品,版权均属于中青在线或中国青年报社,未经本网授权,不得转载、摘编或以其它方式使用上述作品。 2. 本网授权使用作品的,应在授权范围内使用,并按双方协议注明作品来源。违反上述声明者,中青在线将追究其相关法律责任。 3. 凡本网注明“来源:XXX(非中青在线)”的作品,均转载自其它媒体,转载的目的在于传递更多信息, 并不代表本网赞同其观点和对其真实性负责。 4. 本网站文章仅代表作者本人的观点,不代表本网站的观点和看法,与本网站立场无关,文责作者自负。 5. 如因作品内容、版权和其它问题需要联系的,请在30日内与本网联系。

2012年11月28日 星期三
中青在线

语音识别PK:

语音识别PK:谷歌大胜苹果

作者 Farhad Manjoo 编译 Roy 《 青年参考 》( 2012年11月28日   39 版)

    Siri面世已一年有余,如今,它却成了一个众所周知的败笔。就像昙花一现的水晶百事可乐,抑或里克·佩里那匆匆谢幕的总统竞选。苹果对其数字助理工具大肆炒作,Siri仿佛乘魔毯而来,承诺将改变一切的一切。

    去年10月,苹果公司的首席营销官菲尔·席勒向全世界展示了这款全新的工具:“我们有一个梦想,那就是让我们的科技产品可以听得懂对话,为我们做事。几十年来,这一梦想在技术专家眼中一直是一个笑话。”而如今,他认为,这个梦想终于走进了现实。Siri终于可以让你以与人交谈的方式进行人机对话,而且它可以像一个真实的助手那样帮你完成工作。对话的方式是自然的,你无需记忆命令和语法。

    然而,Siri在一开始就给我们泼了一盆冷水。它问题多多,极不可靠。的确,在一些时候,Siri也可以听懂你在说什么,并给出正确的答案,但这取决于你讲话的方式和内容。Siri有时是令人振奋的,可惜振奋的时刻实在少得可怜。

    大多数时候,你向Siri提问会成为对牛弹琴,对话进行下去将越来越风马牛不相及。我同事6岁的小儿子问Siri:“圣母学院队在橄榄球赛中得了多少分?(What was the Notre Dame score?)”它给听成了:“哪里有色情场所?(Where is a porn store?)”(编者注:类似国内流行的段子,Siri把“我想去新疆”听成“我要去嫖娼”),然后非常“贴心”地为他指出了成人娱乐场所……

    即使Siri表面上听懂了你说的话,它也不是真的明白。以下是我刚刚与它的对话: 

    “《007:天降杀机》什么时候放映?” 

    Siri很快做出了相应,为我列出了一个电影播出时间表。还不错。 

    “《林肯》什么时候放映?”我继续问。 

    “今天《007:天降杀机》播放的地点距离林肯镇很远。”它回答,然后为我列出了周边的一些院线信息,那些地名我都没听说过。 

    我再次尝试,这回我几乎是喊出“林肯”这个名字,仿佛自己是被解放的奴隶,正在深情呼唤恩人。 

    可能我对Siri的态度触及了它的底线,回答这个问题都口吐白沫了:

    “今天没有任何名叫《007:天降杀机》的电影是由林肯在林肯镇主演的。”

    虽然这样的事情并不是每次都发生,但是只要发生就足以使Siri不可用。如果你有“气象识别障碍”,窗外雷电交加,大雨倾盆,你还要问“下雨了吗”这么“风骚”的问题,那么Siri完全适合你。对于正常的人,Siri更像是作秀的噱头。

    如今,终于半路杀出了程咬金。上个月,谷歌发布了自家语音搜索服务的iOS版本(此功能在Android平台上已发布一年有余)。在看过两者的对比评测后,我决定亲自尝试一下这款应用。

    可惜的是,谷歌的语音识别功能也没有想象中的那么神奇,它尽管可以比Siri能听懂更多我的话,但也会犯错误,有时也会提供一些无用的答案。甚至有几次,Siri给出了出色的答案而谷歌却出错了。

    即使谷歌语音搜索并不完美,但它是真正可用的。在大多数情况下,它能理解我的问题并且给出令人满意的答案。谷歌语音搜索不仅优于Siri,而且优于我用过的所有其他语音识别系统。它也几乎将语音识别工具由童话故事变成了我们日常生活中可以依赖的帮手。

    谷歌正在以下几个方面作出努力:首先,它为自己降低了成功的门槛。谷歌的语音功能称为“语音搜索”,不像Siri,并没有承诺能成为你的机器人秘书。谷歌语音搜索不会为你安排约会。你可以在谷歌网页上搜索得来的信息,在这个范围内,谷歌语音搜索可以做到有问必答。这些并不完全是设计层面的限制,在iPhone平台,苹果对于第三方应用程序有严格的限制,使得谷歌在技术层面很难做到Siri的高度。但是开发者另辟蹊径,使得谷歌语音搜索超乎你的想象。

    其次,谷歌的用户界面更加卓越。它快得令人惊讶,我刚刚开始讲述,软件就已经开始对问题解码了,于是在我刚刚讲完后,它就给出了满意的答复。相比之下,Siri需要一至两秒来理解我的问题,从而找到答案。

    更令人惊讶的是,对于深谙表面功夫的苹果公司而言,他们的Siri并不具备良好的发音,它所讲的每一句话都带有含混不清的机器人口音。谷歌的声音听起来更像是一个真正的人(谷歌并没有为它命名,但我想象这个声音来自一个年轻的姑娘,她冰雪聪明,梳着棕色短发,戴着黑框眼镜)。

    谷歌语音搜索最为优秀的一点就是其渊博的知识储备。大多数情况它都会对你的问题作出精确的解答。在面临回答不了的问题时,它会保持沉默,但至少给你满满一页的搜索结果,几乎可以肯定总是正确的。Siri在处理这一情况时就相形见绌了,它或者满怀歉意地跟你说它不知道,或者告诉你:如果你需要,它帮你去网上搜。

    谷歌未来的目标是,把电影《星际迷航》中的计算机变成现实,你可以把它当作一个普通人交谈,而不仅仅是为你提供一些选项。

    谷歌语音搜索距其远景目标还有很长的路,但前进的方向清晰。这款应用已经可以支持小范围的交谈。它已经可以理解代词的含义,比如你问:“奥巴马是谁?”然后问:“他的妻子是谁?”它知道这里“他”指的是奥巴马。而最重要的是,它为您提供了正确的答案——米歇尔。

    我用同样的一组问题向Siri提问。首先,它正确地确认了这是美国总统。但是当我问:“他的妻子是谁?”她却反问我:“你妻子的名字是什么?”这与我的问题毫不相干。事实上,跑题跑得很远了。目前还没有任何迹象表明,苹果公司的语音助手软件可以步入正轨。

    美国《石板》杂志

分享到:

 

语音识别PK:谷歌大胜苹果
看球神器
iPad专属的环绕音响套装
触屏的新型手势语言