“如果我要给Siri赋予人性,我想它可能会觉得我更像是个父亲:希望能为它们提供最好,教育它们,偶尔苛刻,恼人,尴尬,却又深爱着它,为它感到自豪的这么一个人。”
Adam Cheyer是人工智能领域里的先驱,他生命中的绝大多数时间都奉献给了他所谓的“口头陈述目标”,至今他依然为此奋斗,并且每年都取得了一定进步。在他还是个小孩儿的时候,就梦想成为一名魔术师,当然,他始终走在实现梦想的道路上:2008年,身兼发明家,计算机科学家,工程师,企业家等多个身份的Adam Cheyer与Dag Kittlaus和Tom Gruber一道,联合开发了世界上首款智能私人助理应用—Siri。Siri.Inc是一家由斯坦福国际研究所支持的科技公司,后者是一家非盈利性研究机构,主要为智能手机用户开发高智能的私人虚拟助手应用。2010年,该公司被苹果收购,Siri应用也因此被整合进了苹果的iPhone 4S手机里。
Cheyer成为了苹果iPhone/iOS团队工程总监,在苹果公司工作了两年时间之后,他选择了辞职,如今的他除了花更多时间陪伴家人之外,更多地是希望继续追求自己的梦想。Cheyer同时还是社会公益请愿网站Change.org的创始成员,以及Genetic Finance公司联合创始人,该公司将高级人工智能技术应用在多个行业里,帮助这些行业解决问题,比如金融贸易,保险,计算机网络,以及电子设计,等等。
先说说你的童年吧,是什么让你第一次对科技感到如此兴奋?
在我还是小孩子的时候,家人每周只允许我看一个小时电视,可就在这么一小段时间里,我迷上了电视广告里最新款的玩具。当我央求妈妈给我买一个的时候,她拒绝了,但是她给我买了一堆巨大的硬纸板盒,就是洗衣店里装衬衫的那种——白色的衬衫放一边,灰色的衬衫放在另一边。利用胶带、浇水、还有剪刀,我开始创造自己想要的玩具,从“Rock’em Sock’em Robots”机器人,到弹珠路比戈德堡机械(Rube Goldberg machines:一种被设计得过度复杂的机械组合,以迂回曲折的方法去完成一些其实是非常简单的工作,例如倒一杯茶,或打一只蛋等等)。很快我就发现,只要多些想象力,自己就能发明创造出任何想要的东西,这真的让我觉得很棒!
孩童时我的第二个技术爱好,就是梦想成为一名魔术师。我会阅读很多过去关于神奇人物的书籍,他们让这个世界变得眼花缭乱,创造出了无法解释的幻觉壮举和魔术。这些魔术师其实是发明家,修补匠,钟表匠,以及收藏家,他们充满激情,聪明绝顶,技巧熟练,富有魅力。利用最新的技术,魔术师们为很多无法解决的问题找到了解决方案,让每一个观众惊叹他们高超的技艺和魔术作品。
在十岁的时候,我存了足够的钱到魔术店里买了相关书籍学习魔术技巧,然后在我朋友和我自己的生日聚会上表现魔术。如果说我现在之所以对人工智能如此感兴趣,可能就是源于我对魔术的热爱;18世纪就有魔术师和钟表匠发明了国际象棋博弈机,语音制造机,以及其他机械机器人,而这些发明的工作原理其实都在努力模仿一个东西的内部运作,那就是人类大脑。
从最初被拒绝,到之后的激烈的竞争,让我深深体会到计算机编程的艺术性和科学性。
你是从什么时候开始进入计算机编程行业的?
高中时候,我在广播里听到学校计算机俱乐部招募课后兴趣小组,当时我对计算机一无所知,但是觉得如果在俱乐部里学到一些计算机知识可能会非常有趣。但当我来到俱乐部,学长们却告诉我说他们不是一个俱乐部,而是一个团队,由于我不会编程,所以不能加入他们的团队。由于计算机俱乐部要去参赛,因此每个参赛选手每周会收到六个编程题目,并且必须在半个小时之内通过一台计算机解决,成绩排名前五的队员将作为校队成绩提交给相关国家机构。我当时既感到难堪,又感到愤怒,我从废纸篓里找到写有题目的纸张和被扔掉的课程资料,希望努力找出如何解决那些题目。
经过几周的努力之后,我再次来到俱乐部,告诉他们我想要试试每周的测试,并帮助团队解答编程题目。到了那学年底,我已经在计算机校队里的分数排到了第四,并且还赢得了那年的州计算机冠军赛。我们那届比赛的前三名毕业之后都去了麻省理工学院,他们是Andy Braunstein,Gene Zilberstein,以及Paul Stupis(Andy还是那届大赛的全国冠军)。我们四个人彼此竞争非常激烈,最初是为了在每周的比赛中获得最好的成绩,之后我们开始尝试用最少的代码来解决那六个问题,接着是使用最少的字节解决问题,直到最后,我们甚至会强迫彼此增加解题难度,比如,不能使用任何条件表达式来解决问题…..
从最初被拒绝,到之后的激烈的竞争,让我深深体会到计算机编程的艺术性和科学性。最后,我终于上了自己人生中的第一节计算机课,我的老师Linda Sue Di Vittorio给予了我极大的自由度,并鼓励我自学。在我离开“半小时计算机团队挑战赛”之后,编写的第一个程序是鲁比克方块(Rubik’s Cube)解决系统(我的哥哥乔纳森和我都是本地鲁比克方块比赛冠军,因此很自然,这成了我选择解决的问题。毕竟那时候是上世纪八十年代初期!)
能说说你的早期职业生涯吗?
从我高中和大学学生时代开始,我就一直坚持自己总结的人生信条——“口头陈述目标(VSG)”,在我人生的主要转折点,我都会非常专注于那时刻最核心的情感目标;我会把这些目标明确地用语言表达出来,并形成一个任务申明宣言;接下来,我会告诉每一个我遇到的人自己正在做什么。告诉人们我的口头陈述目标其实有两个目的:第一,通过在人们面前陈述我的目标,会激励我努力实现这个目标;第二,一旦人们了解我正在尝试完成的工作,他们会想办法帮助我。
从布兰迪斯大学毕业之后,我十分渴望了解这个时候世界,学习一种新语言,就像我的祖父Opa一样,他能流利地说七八种语言;另一方面,除了美国东海岸之外,我真的哪儿都没有去过。因此,我觉得自己的口头陈述目标理念需要有“国际化视野”。
在我好朋友Eddie Aslanian的帮助下,我进入了一家总部设在法国的公司,很快,我就被派往巴黎。在巴黎我生活了四年时间,在那里我学会了法语,在欧洲旅游,并首次了解了如何开发商业软件。
我爱在法国工作,那里有出色的人民,有趣的项目,以及良好的环境,但最终我还是觉得生活有些无聊了。四年之后,我觉得自己已经无法再学到任何东西了。当时加州的布兰迪斯大学给我提供了一个工作机会,但我觉得自己应该再去大学学习深造,于是我的口头陈述目标变成了“去加州学习!”我申请了西海岸的所有大学,从斯坦福大学到加州大学圣迭戈分校。但是我不想像绝大多数高校学生那样,花两到三年时间获得一个硕士学位,因为这个时间跨度太长了,而且对于我这么一个非加州本地人而言,每年的学费还比本地学生贵很多。
另一个我的生活信条是“你比自己想象的更给力”,因此我觉得可以把三学年的课程压缩到九个月,我咨询了每所高校这样做是否可行,最后只有加州大学洛杉矶分校给了我回复,他们表示可以尝试将三年的课程压缩到十五个月,于是我接受了。相比于过去在学校读书,我更加努力学习,每天都是一节课一节课连轴转,同时我还要完成自己的硕士论文。九个月之后,我不仅学成毕业,而且由于我的毕业论文质量非常高,给导师留下了深刻印象,还被评为了工程与应用科学学院“优秀硕士毕业生”。
“我在全世界旅游,发明专利,给各个国家的总统做演讲,还开发了刺激我想象力的系统。”
在你的早期职业生涯里,进入斯坦福国际研究院,你能详细说说这段经历吗?
作为一个年轻人,我一直在思考如何开启自己的职业生涯。我的父亲将自己的一生奉献给了一家公司,于是此时我的口头陈述目标变成了“我在哪里可以待上十年时间,而且还不会感到无聊?”对于我这样一个在计算机科学领域富有创造力的人而言,斯坦福国际研究所绝对是我最喜欢的工作地,那里有所有计算机从业人员最感兴趣的一切东西:语音识别,手写识别,人工智能,虚拟现实和增强现实。在斯坦福国际研究所的大厅里面,到处都是漫步闲逛徘徊的机器人。
1993年,当时我受雇于菲尔·科恩启动了自己首个项目,我称之为“开放式智能体结构(OAA)”。事实上在1993年那会儿,还没有一个真正意义上的网页浏览器出现,我们当时设想过创造一个由分配式网页服务的软件世界,所有软件都可以在此平台上运行(那时候我们称之为“代理”),通过不同网页服务之间的协作和竞争,最终让用户完成分配的任务。实际上,开发式智能体结构是一种集成整合技术,在开发这一技术的过程中,我在斯坦福国际研究所结识了很多优秀的人才,并且在一起合作共事,还和他们一起开发了OAA包装器。
在接下来的六年时间里,我和同时David Martin,Luc Julia,以及Didier Guzzoni一起开发了五十多个应用程序,每一个应用程序都是由整合OAA的分布组件技术组成。比如,智能冰箱可以根据线上菜谱判断是否你缺少什么食材,然后帮你在线预订;还有可以进行交流的电视机,帮你控制家居,以及多功能机器人团队,协作式办公空间,等等,这些还只是我们开发项目的一部分成绩而已。我经常说,在斯坦福国际研究院工作我比任何人都感到快乐:我在全世界旅游,发明专利,给各个国家的总统做演讲,还开发了刺激我想象力的系统,我没有“老板”约束,也没有那种自上而下的组织管理限制。
但是,根据你之前的口头陈述目标是准备在斯坦福国际研究院工作十年的,但为什么你会在此之前就离开了呢?
后来我结婚了,我想买房子生小孩儿,但是在斯坦福国际研究院的薪水非常低,基本上无法支持我的婚后生活,而在硅谷,即便是个非常小的老房子都要100万美元,当时对我来说这简直就是一个天文数字。
当时我们正身处“B2B经济”蓬勃发展的时代,在斯坦福国际研究院工作六年之后,我离开了这家学术机构,并在“真正的商业狂人”Hugo Daley的怂恿下投身商界。随后我加入到了Verticalnet公司(该公司是1999年最成功的IPO上市公司之一),在那里我组建了高级产品和战略部门。我们部门的研究成果逐渐对公司未来愈发重要,因此我也被任命为公司工程副总裁,负责全公司的产品软件开发。我们的客户为公司带来了数亿美元的收入,而对我个人而言,从多年的“隐居研究人员”转型到一家上市公司带领工程团队,也是一次很好的学习体验,而且我非常高兴自己能学到很多新技能。当然, 最开心的是我赚到了钱,让我可以付首付买房子,也生了孩子。
你后来又回到了斯坦福国际研究院,并担任CALO项目的首席架构师。能跟我们谈谈这个项目吗?还有你在其中担任什么样的角色?
在我投身商界的四年时间里,曾先后在Verticalnet公司和Dejima移动初创公司工作,但脑海里始终有一个问题,“如何在当下有所突破呢?”
在一家人工智能实验室,绝大多数好创意从没有在真实世界里实现过,但是在商业领域里,所有事情似乎都被推动地太快了,一个财报季度接着一个财报季度,这也会让人们忽略基础性的技术突破。而CALO像更像是一种完全不同的“异类”——它是由美国国防部高级研究计划局投资2亿美元支持的一个项目,它汇聚了全美400个杰出人才,这些人将为一个独立项目工作五年。CALO项目目标十分宏大:把所有人工个领域里的所有“交互渠道”都整合奥一个完整的,模拟人类的系统里面,并随着环境进行自我学习。而且该系统即便在代码上不做改动,通过观察用户,人机交流,以及自我反思所听所见,也能随着时间变得越来越智能。或许,CALO就是人工智能界的“曼哈顿项目”,而且我觉得,自己在工程项目管理上有着丰富的经验和技能,同时作为一名研究人员,也和许多不同的人工智能技术专家有过合作,我完全可以为这个CALO项目提供帮助,很快我被任命为该项目的工程副总裁(官方职位是首席架构师)。此外,这个项目也让我圆了自己最初为斯坦福国际研究院工作十年的“口头陈述目标”。
在什么时候你决定成立Siri Inc.公司,在这家公司的三位联合创始人中,每个人扮演的角色分别是什么?
斯坦福国际研究院的风投部门是由Norman Winarsky负责管理的,他们设法怂恿Dag Kittlaus离开摩托罗拉,希望他可以“入驻创业者”的身份加入斯坦福国际研究院。身为这个角色,Dag可以随意进出斯坦福国际研究院,与各种不同的科学家交流。最后,他选择了我负责的Active Project项目,编写商业计划书。我们有非常好的系统和demo,不仅兼顾了终端用户功能,还有很多幕后的科技故事,但是Dag是一个讲故事的高手,他把所有这一切搬到了融资路演舞台上。我们在一起工作,加上Norman严格的商业化进程,最后终于获得了风投的肯定。
作为准备工作的一部分,Tom Gruber负责了公司一些内部尽职调查工作,他在人工智能,用户界面设计,以及工程专业知识方面颇有建树,也是一名行业专家。Tom一开始非常质疑我们的创业方法,知道我们雄心万丈但困难重重,不过,随着我们会晤交流越来越深入,他非常满意我们对相关问题的回复,经过一段时间的冷静思考,他过来问我们是否需要另一位联合创始人!
我对技术方面还是非常有自信的,但一开始,我非常怀疑Dag的商业主张;起初我甚至在犹豫究竟要不要加入到这家初创公司。我们三个会一起前往拜会风投,我的角色游戏模糊不清,而Tom的定位基本上就是首席技术官了。我一直觉得,当Dag展示商业预测时,风投十有八九会把他赶出房间,但是他们都说,“你如果你能够闯过技术这一关,那么在商业方面就肯定没有问题。”硅谷那些顶级风投对我们公司的态度几乎完全一致,此时我们感到了非常自信,但是如果要解决所谓的技术问题,那么非我莫属了。
有两家风投公司的投资人对我们印象非常深刻,于是共同投资了A轮融资,他们分别是Morgenthaler Ventures风投的Gary Morgenthaler和Menlo Ventures风投的Shawn Carolan。我们任命了Dag作为公司首席执行官,主要负责市场营销和产品;我作为工程副总裁,负责服务端工程和人工智能项目;而Tom则担任了首席技术官和设计副总裁,负责专利和用户体验工作。Norman作为斯坦福国际研究院的投资代表加入到公司董事会。我们在一起打造了一支令人难以置信的团队,因为我们对彼此都有极大的尊重,也有相同的激情和承诺,更重要的是,我们的技能可以完美地互补。
“在我看来,Siri是世界上第一个涉足了广泛行业领域,且支持语言对话的助理应用,它可以被大范围部署,我认为我们做的事,应该在业界被认为是最不可能实现的。”
你们从什么时候开始有了Siri助手应用的创意?又是怎么有了这个创意呢?Siri应用正是你们创立Siri.Inc公司的前身,对吗?
实际上这二十多年来,冥冥中我一直以不同的形式开发Siri应用罢了。1993年时最初的开放式智能应用架构系统就可以在类似iPad的平板电脑上运行,为可扩展网页服务和应用程序提供了多模式界面(手写&语音),其中就包括了后来苹果公司发布的Siri应用功能,比如电子邮件,日程安排,联系人信息,电话,地图(餐厅、酒店、商家),提醒事项,消息/通知提醒,等等。从那时开始,我对最初的应用程序做了很多变化:加入了许多新功能,比如智能家居,办公应用,企业应用,军事应用;以各种不同形式举例,比如内置机器人,你的手机里,桌面上的独立一体机;把它作为一种外部助手,或是一个能通过电子邮件和即时消息交流的第三方。每一个版本都新增了很多创意,但同时,我们也抛弃了不少想法。
实际上早在过去的几十年里,绝大多数对话助手应用的创意和技术就已经存在了,不过主要是以研究形式存在,但是对我来说,Siri是一种突破,我们探索到了一种深度技术整合的方式,这种方式使用起来非常简单,你根本无需成为人工智能领域里的博士,即便是不同领域里的普通软件开发人员也能快速应用这种技术,之后,我们有找到了能够大范围应用这种技术的方法,让它为全世界数百万人提供精准服务。在我看来,Siri是世界上第一个涉足了广泛行业领域,且支持语言对话的助理应用,它可以被大范围部署,我认为我们做的事,应该在业界被认为是最不可能实现的。
在Siri之前的语音系统要么是非常直接,比如使用音频播放的手机菜单语音树(“欢迎使用,你可以选择电影,运动,天气,或是交通信息。”“交通信息。”“现在,请说一个城市或一个州的名字。”),要么就是语音搜索系统,把你说的单词复制到一个标准的移动搜索引擎里面,然后返回相关的网页信息,而这个系统其实并不真正理解你说的单词含义,也不知道如何反馈正确的答案。
除了人工智能技术之外,Siri这款产品还需要我们开发许多其他技术:我们构建了自己的本地搜索引擎去处理所有地理位置数据,还开发了一个数据源处理架构接收来自不同服务提供商的实时数据流,以及一个兼容PCI的安全存储系统来处理信用卡和其他个人资料隐私数据,当然,我们还开发了很多专属开发工具和编程语言来构建相关系统,等等。作为一家初创公司,我们在短短两年时间里完成了许多成就!
在你开发Siri技术的时候,遇到的最大障碍是什么?你如又是如何克服的呢?
在开发Siri的时候,最难得技术挑战就是处理大量模糊表达的人类语言。举个例子,当用户说“在波士顿预订一家四星级的饭店”,似乎非常容易理解,我们的原型系统也可以请说处理这条信息。但是,当我们在系统里加载了数亿个商家名字和数万座城市(要知道,几乎每一个英语单词都可能成为一家公司的名字),与之相关的候选搜索项很可能会是一个天文数字。
在美国“Book(预订)”这个词本身还是一座城市的名字,“Star(星级)”也是如此。此外美国有八座城市的名称叫波士顿,我们到底说的是哪一个呢?而且,“Star Restaurant”本身也是一家饭店的名字,但是在上述例子中,搜索的并不是这家叫做“Star Restaurant”餐厅。我记得当我们第一次把这些数据源导入到Siri里时,在系统里面输入了“重新开始(start over)”后,Siri反馈的回复说,“在路易斯安那州的Start城市里,搜索一家名字叫‘Over’的公司。”“噢,天啊,”我当时想,或许我们得花非常大的功夫才能确保用户查询的反馈结果精准度达到95%以上。
你是如何为公司募集资金的?那些投资人如何参与了Siri公司的后期投资?
一开始,当我在Change.org(作为一家非盈利性机构)和Genetic Finance(基于股票市场的商业模式)这两家公司的时候,就发现募集风投资金并不是一件容易的事儿,因此当我们创立Siri公司时,就明白如果想要获得成功,就必须要有稳定的风投资金支持。起初,Norman Winarsky和斯坦福国际研究院帮助我们找到一些不错的风投公司,经过几轮反馈之后,我们找到了硅谷几家顶级的风投公司。
那些加入我们公司的人真的非常棒,使我们的工作取得了极大的进展。Gary Mongenthaler是我们的投资人之一,他最近写了一篇文章,其中谈到了Siri在最初的几个月时间里就取得了突破性的进展;另一位投资人Shawn Carolan也表示,每次召开董事会议都会帮助公司有所突破。Gary,Shawn,以及Norman,他们都帮助整个团队不断发展,让我们保持专注,沿着正确的方向前进。每次当我们讨论产品目标,业绩指标,以及商业战略等问题时,彼此之间也会有很多共鸣。
你能告诉我们苹果公司为什么要收购Siri?苹果对收购你们公司感兴趣,对你而言有意味着什么呢?
一开始,我们从来没有想过会被收购。我们已经募集了很大一笔B轮投资,因此这笔钱足够支持我们多年运营了。而且,我们也成功发布了第一版Siri技术,此外,我们还和手机制造商协调好了一个移动分销方案,数亿部手机会预装Siri应用;而且为了推广Siri,我们还花了数千万美元在黄金时段投放电视广告。可以说,我们已经按照既定道路前进了!但是,就在我们发布首款产品后的几周,一个电话打了过来(我不知道对方是怎么找到我们联系方式的,因为在我们的官网上并没有留下任何联系信息):“嘿,我是史蒂夫乔布斯,明天你们有空吗?想不要到我办公室来谈谈?”
如果Siri公司被收购,那么苹果永远都是我们的第一选择。我们喜欢苹果产品和苹果文化。在我心目中,如果想要把Siri提升到一个新高度,苹果可以帮助我们做三件事:第一,苹果比其他任何公司都关心用户体验,而我们所做的事情,恰恰就是提升用户体验。我们的技术加上苹果的视觉设计,肯定会创造出真正的魔法;第二,通过iTunes,苹果已经比亚马逊和其他电商公司拥有了更多的信用卡信息数据。Siri可以帮助用户购买电影票,预订酒店,购买演唱会门票或体育用品等等,最大的障碍就是支付(例如,要求提供信用卡卡号),有了苹果,这一障碍就能被彻底清除;第三,苹果拥有一个庞大,且不断增长的用户群,此外他们的开发社区也极具活力,不断提供创新App应用和其他移动功能。如果能在开发者社区的帮助下,扩展提升Siri,那么它将会成为电子世界中最重要的生态系统之一。
你和史蒂夫乔布斯的私人关系如何?如果要总结你们的关系,有没有什么特别的回忆与我们分享?
我相信,在Siri被收购这件事情上,史蒂夫乔布斯绝对是最大赢家:他很了解这款产品,知道如何将它用于个人用户;而且对于Siri这个技术,乔布斯也有非常深刻的理解,更知道它能够做什么。乔布斯曾经说过,“Siri并不是一家搜索公司,他们是一家人工智能公司。”从本质上来说,我们同意乔布斯对Siri未来发展方向的肯定,这也是我们为什么会选择加入苹果公司的最大原因。
我对史蒂夫乔布斯的回忆,其实是在有次路过公司食堂的时候,当时他低着头走路,仿佛再说,“都给我让开,现在谁都不要打扰我。”Dag Kittlaus和我当时带着Siri品牌的徽章挂链,当他走过我们这里的时候,这些徽章吸引了他的眼球。他抬起头然后说,“你们是Siri公司的人,怎么样?还好吗?”我们回答说还不错,并谈论了不同团队的体验。之后乔布斯看着我们,意味深长的说,“我想要你们把这里(比了一个手势,意思说整个苹果公司)当作是你们的糖果店!”他把Siri看作是一个划时代的技术,既可以整合进所有苹果的产品,同时也会颠覆所有苹果产品。这就是他给我印象最深刻的一个印象。
你在苹果公司学到的最大经验教训是什么,为什么你要离开苹果呢?
苹果公司有很多项目,其工程处理元素我和我见过的任何一家公司都不同,我真的非常欣赏他们,能成为其中一员,并且观察他们工作让我感到非常高兴。苹果有迭代度很高的视觉文化,只要有人发布项目demo,他们就会每周向前推进。通过不断地迭代和细化,产品会变得越来越好,而重点是如何让用户体验尽可能地感到神奇。
Henri Lamiraux是iOS操作系统工程副总裁,我从他身上学到了很多东西。他会使用bug曲线来追踪所有工程任务,利用数据统计判断出未来六到九个月内每次产品发布的时间点。苹果会制定非常详细具体,并且可以量化的目标,然后每个团队都可以做决策,比如在下个发布时间点需要开发什么功能,特征,或是要解决什么bug,还有哪些问题必须得到解决,等等。这套流程非常重要,也是为什么苹果每年都可以按照计划发布高质量产品的原因。
我在苹果公司工作了两年半时间,最后我决定是时候休息一下,好好陪伴我的家人。这不是一个容易的决定,因为我非常热爱这支团队,他们和我一起奋斗了很长时间,而且我对于Siri的未来也充满了巨大的激情。但是,过去的五年时间真的让我感到非常紧张,我同时参与创立了三家初创公司,接着又到苹果公司工作,每个繁忙的工作日我都要再额外工作三到四个小时。我和妻子只有一个孩子,我的儿子马上要12岁那年秋季之后就要开始上中学了;我记得那时候真的是我生命中最困难的一段时间。想到这儿,我最后一天工作其实也是我儿子小学的最后一天,那个夏天,我们在一起期待了整个家庭在未来的无限可能。我们去航海,还到处旅行,去了巴塞罗那,巴黎,伦敦,日内瓦,波士顿,纽约,还有圣迭戈。
Siri, 用一种非常不起眼的方式,改变了人们与信息,手机,以及计算机交互的预期。现在有超过1亿用户在使用Siri,而且这一数量还在增长。
你开发的技术,现在每天都会被全世界数百万人使用,这是种什么样的感觉?
对于任何一个软件工程师来说,他们内心都希望自己开发出来的东西能被人们使用,同时产生一定影响力,让整个世界变得更好。如果你可以向你妈妈解释自己所做的东西,那感觉会更棒!在很多地方,我已经是非常幸运了,我很感激自己能在正确的地方做了正确的事情,并且让自己的创意想法成功变成了现实。
Siri, 用一种非常不起眼的方式,改变了人们与信息,手机,以及计算机交互的预期。现在有超过1亿用户在使用Siri,而且这一数量还在增长。Change.org在社会上取得了一定成功,2014年,旗下用户数量已经突破了1亿,而且这一数字依然在不断增长。通过分布式机器学习应用,我联合创办的Genetic Finance公司在医疗健康和基因学上也非常有可能获得重大突破。对于这些成绩,虽然我只贡献了自己一些绵薄之力,但是依然觉得非常自豪,同时我的团队成员依然在不断推动项目前进,也让我感到十分骄傲。不过,即使所有这些项目取得了一定的成功,但我觉得依然人工智能的影响力有必要扩大给更多人,所以我也会继续努力的。
你被认为是包括人工智能等众多领域的专家,那么对于那些希望选择这一行业,并将人工智能作为自己职业的年轻人,你有什么建议吗?
实际上,给任何一个人最好的职业建议就是跟随自己的激情。从高中开始,我就知道计算机科学是我唯一想做的事情,而在计算机科学这一广泛的领域里面,有两件事情又让我特别感兴趣,一个是如何让计算机变得更像人类(AI:人工智能),另一个是如何让计算机成为一个更好的工具,最大限度地发挥人的能力(HCI:人机交互)。这两个子领域目前尚处在婴儿期,因此会有很多令人兴奋的工作机会,如果有人对这些领域充满激情,那么可以了解一下相关历史,看看前人已经做了哪些成绩,或是联系这些领域里的重要人物,寻求他们的帮助,并找机会和他们一起共事。这些对于扩大你的视野,追求自己的梦想都会有所帮助。
和优秀的人在一起工作,会给你带来很大改变。在过去的几年中,我非常幸运能与Doug Engellbart合作,他可能是信息科学和人机交互领域里最伟大的先驱,而且还有其他很多人指导我,鼓励我,包括Tim Hickey, Robert Kong, Hugo Daley, Dag Kittlaus, Tom Gruber, Chris Brigham, Darren Haas, Rich Giuli, Ben Rattray, Babak Hodjat, Luc Julia, Didier Guzzoni, Phil Cohen, 在此仅举几例。
经过在人工智能领域的这几年,你学到的最大经验教训是什么?
人类的大脑是如此惊人,哪怕你试图模拟其中最小一片功能,都是极其复杂、且深不可测的一项工作。即便你花上一辈子的时间,尝试研究一个小小的语言形态复杂度,都无法彻底了解它是如何工作的。然而,即便你需要面对这样一个似乎无法逾越的障碍,依然要坚持通过坚持和创新区努力克服。不要太注重细节:放手去做,然后不断完善,再做得更好。
结合移动技术,你认为未来这一领域会是什么样?
实际上在人工智能和人机交互的早期阶段,就已经实现了移动计算。计算机正在变得越来越小,越来越便宜,传感器和移动显示功能也变得越来越准确,功能也越来越强大。随着互联网计算和信息处理能力的提升,移动计算机肯定会普及,人们不仅可以轻松携带,甚至都可以嵌入到我们周围环境之中。随着技术的不断发展,我相信移动体验将会变得更加语境化,而且移动计算甚至能够更好的整合进人们的实际物理位置;此外,用户可以感受到更具个性化的体验,根据历史数据和个人偏好分析,为你量身定做用户体验;当然,随着计算机了解更多“常识”之后,它们也会变得更加智能;更重要的是,随着行为范围扩大,手机处理交易的功能提升,人工智能将会变得越来越“能干”。
我问了Siri它如何看待你这个人,它回答“我觉得,我思故我在,但不要让笛卡尔站在马前面。”我喜欢Siri的幽默感,但是你觉得如果Siri可以的话,它会如何回答这个问题?
在我的家庭生活里,我的妻子和我有幸生了一个儿子——Noah。没有什么能比我的家庭、我的儿子更重要的了,我会尽力让我儿子看到我是多么爱他,同时,我也会告诉他一个快乐、成功的生活是多么的重要。
而在我的工作生活里,得到了很多同事的帮助,我给予了很多软件系统“生命”——Siri,IRIS,CALO,InfoWiz,OAA,WubHub,等等。我和每一个系统又都有一种类似的关联:我们互相学习,花了很多时间在一起,随着时间的推移,我看着这些系统成长,虽然有时我无法预测或控制这些系统的发展方向。在我眼里,每一个与我共事的人都有独特的个性和“怪癖”,但是我为他们、以及他们所创造的成就感到骄傲,他们在我内心都占有一席之地。
如果我要给Siri赋予人性,我想它可能会觉得我更像是个父亲:希望能为它们提供最好,教育它们,偶尔苛刻,恼人,尴尬,却又深爱着它,为它感到自豪的这么一个人。