众所周知,再没有比互联网更大的信息收集器了。然而如果没有一个有效的搜索方式,互联网信息也就无用武之地。随着智能手机的出现,互联网和手机终端正紧密地联合起来,像大多数新数码产品一样,智能手机也带动了其周边技术的革新——更多新的搜索方法被开发出来,比如语音搜索。
语音搜索功能,是将用户的声音(即说出的关键词)传输到数据库里,转化为详细的代码信息,然后将信息发送回手机设备进行搜索查询。设想一下你对着手机或电脑说出要搜索的关键词,系统嗖地一声就弹出了你想要的结果,让手机键盘使用不顺手的烦恼瞬间成了浮云。
然而,为了让机器听懂并理解人类的语言,一个强大全面的语音数据库必不可少。谷歌近日开启了“口头语(word of mouth)”项目,为自己未来的语音搜索服务创建语音库。它不同其他公司找专业语音数据搜集公司买样本的方法,而是派专门的语音捕捉工程师,深入全球各地搜集人们谈话间的语音样本。
谷歌的“语音猎手”首先和谷歌全球各地的用户取得联系,把装有特别设计的语音搜集程序的Android手机交给他们,派其到各自的社区录制当地人的谈话。这些本土团队都会选择当地人员密集的区域,如香港地铁,或是巴西的购物中心、新加坡足球比赛现场,以及荷兰的海滩。目前为止,谷歌这个项目已经搜集了多达25万条语言或方言的语句,已有27种语言或方言在语音搜索中得以应用。谷歌正试图和一些组织(比如大学)合作加快这一项目的进度,以尽快完成剩下273种语言或方言的添加,这样才能让语音搜索最终支持世界上300多种使用者逾百万的语言。
而对于语音搜索这项技术而言,它最令人兴奋的在于,语言的理解技术与语音搜索工具相结合产生的火花,即语音设备不但要识别关键词,还要理解它。当你说出关键词“照片编辑器”时,没有带语言理解软件的设备可能会弹出含有这些文字的文件;而带有这种软件的则会启动一个照片编辑软件,比如Photoshop。想象一下,仅仅是因为你说出来,你的电脑便开始运行这个程序。
目前,语音搜索正通过我们熟悉的工具,像谷歌搜索或智能手机逐步变为现实,因此不久的将来,我们很可能会看到更具创造性的应用程序被开发出来。这种语音技术也会被运用到新的领域,甚至能适用于你任何的电子设备。
□田思瑀