12月4日,在第四届世界互联网大会“大连接时代:创新智能变革”分论坛上,搜狗CEO王小川发表了主题为《人工智能带来的大连接时代》的演讲。此外,搜狗“基于语音合成的机器同传”也在大会上首次亮相,基于搜狗语音识别、合成、机器翻译、风格迁移等技术,搜狗机器同传不仅实现语音到文字的中英实时同步翻译,还可以根据说话人的声音进行数据训练,输出与说话人原语音音色相同的译文语音,达到真正“音意同步”的同传效果。
12月4日,在第四届世界互联网大会“大连接时代:创新智能变革”分论坛上,搜狗CEO王小川发表了主题为《人工智能带来的大连接时代》的演讲。此外,搜狗“基于语音合成的机器同传”也在大会上首次亮相,基于搜狗语音识别、合成、机器翻译、风格迁移等技术,搜狗机器同传不仅实现语音到文字的中英实时同步翻译,还可以根据说话人的声音进行数据训练,输出与说话人原语音音色相同的译文语音,达到真正“音意同步”的同传效果。
基于此项技术,王小川与在场的嘉宾讨论了人工智能与大连接时代的关系。他认为,人工智能技术的应用,将解决互联网时代连接的瓶颈,从“解决信息的流动和不对称”走向“帮助用户进行判断决策”,最终带来大连接时代。
传统的连接,是指连接人和人、人和信息、人和交易,包括现在的连接服务和连接设备。但是在大连接时代,下一步连接会向什么方向发展?在演讲中,王小川表示,连接的下一步发展,开始需要人工智能技术的接入。“人工智能解决的问题主要有三类,识别、生成、决策。这三个模式将重新赋能大连接时代。”
他提到语言相关的人工智能技术在其中起到了重要的作用,而搜狗的人工智能技术就是以语言为核心的。“从狭义的人工智能,到广义的人工智能,语言是中间的交界点。因为语言既可以做简单处理,同时也是通用人工智能时代推理和知识的载体。语言可以承载我们的感知,将听觉、视觉获取的信息转化为文字”,比如在展会上,搜狗展示的唇语识别技术:不用听声音,只需要看说话人唇部的动作,就能识别其说话内容。“此外,文字本身也能建立问答、对话和翻译的能力,通过这种能力,能给大连接时代提供更好的机会。”
“今天,大部分人还是基于中文交流,如果要与西方人交流,这时就需要翻译系统”。王小川以落地在输入法中的翻译技术为例,解释了人工智能如何解决人与人之间的连接问题:借助搜狗输入法中的即时翻译功能,在对话中,无需切换到翻译软件,只要点击左下角的“翻译”按钮,便可以实现中英文的转换,甚至可以直接用中文与说英文的朋友沟通。
当谈到人与信息的连接时,王小川指出搜索在其中承担了重要的作用。而机器翻译技术和问答在搜索里的应用,能使得人们连接到更加全面、有用的信息。一方面,通过英文搜索,不擅长英文的人也能搜索和阅读全世界的医疗,科技,人文信息。相对于传统搜索,中国人获取信息的能力大幅提升;另一方面,借助问答能力,我们在搜索问题时,将能获取直接的答案,而非一堆链接。
“人机交互的方式也在随着人工智能的发展而改变。”从键盘、鼠标,到触屏,到现在用语音、手势、表情,人工智能让机器开始逐渐适应人的习惯,而不再需要人去适应机器。王小川现场还特别展示了搜狗的风格迁移技术:机器通过学习其过往演讲的语音素材,合成了一首《我的滑板鞋》——音色与王小川一样。他解读到,“在语音、图像里,机器不再只是简单地做识别,而是能生成和你一样的个性化的声音,做声音风格的迁移”。
人工智能技术在垂直领域中的应用,则能把人与服务连接,帮助人们做出最佳决策。“比如医疗服务和法律服务。目前医生、律师的数量不足,只靠单纯的连接这些人,还不能满足用户需求。人工智能通过对此前服务样本的学习,可以回答简单通用的医疗、法律问题,部分取代医生、律师。”王小川表示,搜狗正是因此发布了搜狗明医、搜狗大律师两款产品。
比如在就医时,以往分析疾病类别、排队挂号就有大量决策成本、时间成本,通过“搜狗明医”的智能分诊功能,人们可以获取相应的就医信息;而通过“搜狗大律师”,人们可以给出自己的问题,直接获取法律相关的咨询建议。
王小川表示“搜狗的使命是让表达和获取信息更简单”。而这其实就是人工智能在大连接时代给我们生活带来的改变:语言不再成为沟通障碍,人与人的连接更加紧密;我们能获取更加全面、精准的信息;人机交互方式更加自然;在服务中,机器也能开始帮助我们做决策。
网友评论