Siri究竟牛在哪里?深入苹果智能助理

互联网 | 编辑: 潘翔城 2011-10-12 00:00:00转载

不久前,苹果公司宣布下一代iPhone将启用一项新的语音识别系统:Siri。Cult of Mac对Siri进行了一番深入的解析,看过此文或许能让你更有理由相信,人工智能已经走进我们的生活。说到Siri,这是一道硬菜。可在Android上,这个功能一年前就有了,苹果不过是想在这方面“不输他人”,而且其功能也并非如此强大。对吧?错。除了它确实是一道硬菜以外,其他的都错。

其实,Siri是十年内移动平台上最重要的事件之一。

对Siri持否定看法的人一般会分成两个阵营:一边会说它没什么了不起的;另一边会说Android上之前已经有了。这两方的说法都不正确。

Siri的意义相当重大

我们不妨先从Siri的血统说起。Siri直接发端于史上最大的人工智能项目:五角大楼的CALO项目。CALO是“Cognitive Assistant that Learns and Organizes”的缩写(会学习和组织的认知助理),这个项目汇聚了全球人工智能方面的顶尖科研人员。

整个CALO计划的带头人名叫Adam Cheyer,他现在也是苹果iPhone团队的工程总监。

在《麻省理工技术评论》的采访中,Cheyer说CALO早已开始探索如何把“对话、自然语言理解、视觉、演说、机器学习、制定计划、理性思考、服务代表全部融合到一个⋯⋯模仿人类的助理中,帮助人们完成不同的事情。”

他形容说Siri计划就是寻求在一件消费产品中做同样的事情。其实,在过去的四年里,Cheyer和他的团队一直在钻研如何优化CALO,使其能够在一台强大的移动电话中发挥效用,每天都能被成千上万的用户使用。在过去一年半中,他们把主要精力放在Siri技术和iOS及其应用程序的整合上。

它不是单纯的“声音识别”。它是人工智能。当人工智能进入了你的手机,难道意义还不够重大?

Siri和Voice Actions是两码事

Android系统的Voice Actions也是一项伟大的技术,并已经被许多Android用户所熟知和使用。但说真的,它和Siri不是同一个层面的产品。

Voice Actions提供了非常坚实可靠的声音识别引擎,它的高识别度把曾经一度流行的语音识别工具都比了下去。

不过,和过去的所有语音命令系统一样,它要求你说的话严格符合一系列特定的语法,否则它就无法理解。

Siri和以前公众使用过的所有产品都不相同。你说的话可以和你想表达的意思在字面上毫不相干,从严格的技术上看也似乎是文不对题,但Siri会根据上下文、人类历史以及能够理解一般人类语言的人工智能去分析,并在多数情况下领会你的意思。

打个比方,你想小睡一会,并准备上个闹钟,只需要说“20分钟后叫醒我”。如果你想查阅后面的日程安排,你可以说:“我今天接下来都有什么事?”

这些语句中既不包括会用到的应用程序名称,也不包括所需数据的名称。Siri仍然能够理解。

对人类而言,这些句子再平常不过了。但要让机器去理解这些变化多端的棘手词汇,就是人工智能的圣杯了。

而更加人性化的特点是,一旦你开始和Siri进入一段对话,它甚至能理解许多含义模糊或者引申的语义。比如,你可以问它:“步行范围内有没有什么顶尖的意大利餐馆?”如果Siri查询后回答“没有”的话,你可以说:“那墨西哥的呢?”Siri会将你的这个问题连同上文的“顶尖的餐馆”和“步行范围” 一道进行理解。

Android的Voice Actions做不到这样的事情,因为它是一个声控命令软件,而并非人工智能。

Siri有时会为你显示网页搜索的结果,有时能替你执行一些操作,有时能够直接控制iPhone里的应用程序。

而且Siri同样能够回答问题,这要归功于它整合的Wolfram-Alpha。你可以随机提问:“30英里是多少公里?”,“巴黎现在几点?”, “钢琴上有多少个八度?”,或者“天空为何是蓝色的?”Siri能够直接回答这些问题。不是唰地显示一个网页。就是回答你的问题。

关于Siri,重中之重是什么?

从历史和文明的角度来看,关于Siri,最伟大的事情并非人工智能本身。而是苹果通过Siri把人工智能带进了现实生活中。

理由就是:苹果将Siri做成了iPhone的一个核心组成部分,并且让它作为手机使用的主流,让每个用户都觉得除了使用很方便之外,更想时时刻刻都尝试使用它。

提到“主流”,我指的是捡起那些被人类文明边缘化了的东西,并使其成为大量人群每日生活的一部分。现在,Google出品的Voice Actions不得不面临被边缘化的境地。一般人甚至都没听说过它。

Siri会成为主流的。人们会逐渐熟知它,甚至包括非iPhone用户。

爱迪生并不是发明灯泡的人。他是通过产品设计和市场营销,将灯泡变为主流的人。

福特并不是发明汽车的人。他是通过控制成本和市场营销,将汽车变为主流的人。

我们总是记住那些将事物变成主流的人,因为正是这些人和公司让科学技术真正融入每个人每天的生活。于是,说道灯泡,它就溯源于爱迪生;说道汽车,它就溯源于福特。

Google的Voice Actions并非人工智能,虽说它确实让用户省去了打字输入、触摸操作的工序,只需要使用声音去控制机器就可以完成一系列事情。但是,Voice Actions最终没有让声控成为主流。或许一些极客们会学着使用它吧。

然而,妈妈们会选择Siri。

And One More Thing(还有一件事)

iPhone 4S也许会成为第一款支持蓝牙4.0的手机,这项技术可以降低能耗,同时可以做到一件非常特别的事:唤醒设备。

如果把Siri和这项无线技术结合起来,其使用范围就更加广泛了。例如,可以想象你戴着一款“超长待机”手表,它会一直睡眠,你触摸它才会显示时间,或者在iPhone收到短信时,手表会被Siri唤醒。你如果要和Siri交谈,只需要对着手表说话就可以了,甚至连手机都不用掏出来。

同样,可以试想一下,有这么一款桌面麦克风,当你说话时会唤醒iPhone,就像《星际迷航》里那样不用按任何按钮直接说话,并从企业号,呃我是说iPhone的人工智能,得到回应。

那么让我们来总结一下Siri对于人类而言意味着什么。Siri是人机交互新纪元的黎明,是大众进入真正的人工智能时代的开端。

当然,目前它尚未达到完美,苹果目前将其定位在“beta”阶段。并且,它也还不是你在科幻电影里看到的那种无限高能的人工智能。

但它的步伐远未停止。iPhone 4S里的Siri只是一个开端。相信以后会有更加复杂的版本出现。

Google、微软和其他公司也终会拿出自己的人工智能产品的(并且我预言就是按照这个排序)。

所以,一旦你最终和Siri搭上话了,请善待它。Siri具有非常非常重大的现实意义,和以往任何产品都不同。它能够代表计算机发展的一个新纪元。当然,它会让每个人都“说”起来的。

相关阅读

每日精选

点击查看更多

首页 手机 数码相机 笔记本 游戏 DIY硬件 硬件外设 办公中心 数字家电 平板电脑