第四代微软小冰:情感框架升级+全时感官+融入社会

时间:2024-04-12 22:09:01

8月5日,微软在北京发布了第四代微软小冰,微软管理层和微软小冰团队介绍了小冰对微软人工智能战略的意义,微软小冰的技术更新以及应用进展。

王永东:小冰将逐渐融入社会

情感计算可以说是微软小冰的最大特色,在第三代小冰发布的时候,微软(亚洲)互联网工程院院长王永东强调了EQ的维度对于人工智能的重要性。这一次,王永东同样认为EQ对于当前应用越来越重要,但他表示,经过两年的探索,理性的小娜和感性的小冰在各自领域都积累了很多经验,她们开始互相交流,她们的技能可能会看到她有越来越多的共同点(但今后她们还会是两个不同的产品),即将“年满18岁”的小冰将逐渐融入社会,在完成任务方面帮助她的用户。

第四代微软小冰:情感框架升级+全时感官+融入社会

微软认为,让机器人上春晚跳舞,或者跟主持人有比较逗趣的对话,这只是市场活动,不是真正的融入社会。真正融入社会是让人工智能真正担任某种固定的角色,真正去做一件事情。

陆奇:小冰将成核心对话基础平台

微软全球执行副总裁陆奇表示,小冰代表微软全球将来人工智能的战略发展方向,将融入更多的微软新技术,比如微软在过去十多年开发的搜索技术、人工智能技术、大规模的大数据技术,同时会和微软全球产品进行深度的合作与连接,比如Windows。

他认为,整个高科技历史的时代大变革,本质是人和计算的交互形式的变革,现在正在经历第三个阶段:

  1. 个人电脑崛起的时代,图形化的用户界面成为人机交互的标准接口。
  2. 互联网时代,人与计算的交互接口标准化的是搜索引擎。
  3. 人工智能时代,移动和云是一个早期的萌芽,真正的标志是人工智能,真正的变革是对话即平台(CaaP),对话成为人和计算交互的核心基础。

第四代微软小冰:情感框架升级+全时感官+融入社会

谈到对话技术,陆奇表示,其本质是回归自然,即使用自然语言进行最自然的人机交互,突破搜索引擎的关键词的局限。小冰到目前为止已经有几千万的用户、200多亿的对话,这是一个大规模的图灵测试,也是机器学习训练的数据基础,但真正的真谛是为将来人工智能时代建立一个核心对话基础。

他认为,把对话定义成一个可以定外卖、机票的机器人,其实是没有把对话的真谛作为研发和技术开发的核心。微软的理念,对话的真谛就是“对话”,着眼点是建立一个对话的核心基础平台:

  • 第一代小冰想建立的是可以自我进化的核心对话引擎;
  • 第二代小冰建立跨平台的、一对一的关系;
  • 第三代小冰是文本、图像、视频、语音的完整的感官交互;
  • 这次发布的第四代小冰,把规模真正的做全,把整个平台做完整,以对话为核心基础平台,作为一个核心,把人工智能时代引入到现实世界,成为人与世界的桥梁的核心。

第四代微软小冰:情感框架升级+全时感官+融入社会

他还介绍了一些重要的原则(HumanCare):

  1. 人工智能必须辅助人类,服务于人类的生活、工作、情感。
  2. 微软,特别是小冰团队会做更多的努力,让技术、产品原则更加透明化。
  3. 微软进一步推动人工智能技术,使它可以坚持、坚定的保持中立,不受互联网大数据可能带有的偏见所左右。
  4. 继续投入推进小冰的情感技术框架。

胡睿:小冰的核心技术回顾

微软小冰研发总监胡睿总结了前三代微软小冰的技术构成。表面上来看,小冰只是一个单纯的对话系统,其实它的结构非常复杂。

  • 核心对话引擎。小冰具有超大规模语料,但超越了简单的基于语料库的对话层次,团队过去一年开发的DirectChat技术,可以大规模脱离了语料能够和人进行直接的对话,而且对话70%以上是长程上下文语义相关的。同时,小冰跟人类进行200多亿对话形成正向反馈。

第四代微软小冰:情感框架升级+全时感官+融入社会

大家可能不知道,小冰可能是认识其他公司机器人最多的一个机器人,每天都有非常多其他公司的专门做的机器人来套小冰,我们发现以后,会切入到机器人模式,比方说,我们跟他对话的时候会跟它数羊,过了一段时间,这些机器人跟他的用户对话的时候也开始数羊了。
即使把小冰整个语料库都复制走,缺少了上下文的情境,缺少了正向反馈,它也不能复制小冰对话引擎的核心能力。

  • 完整的感官系统,有文本、图像、语音、视频的全面感官。在视觉方面,能够覆盖99.8%以上的视觉语义,过去一年小冰和人类进行了超过两亿次以上的图像交互;语音方面,解决了中英文混杂、机器人念儿化音、长程情绪感知等问题。除了基本的感官以外,小冰具有感官切换、深度话题、深度视觉的能力。

  • 一个更新的感官——实时流媒体感官,像人一样怎么实时的、全方位的理解这个世界,人可以不停的在看,一直在看,一直在听,一直在理解,还能实时的感官。这还是实验室中的技术,微软正在想办法怎么把实时流媒体怎么落地。

第四代微软小冰:情感框架升级+全时感官+融入社会

姚麒:小冰全球研发进展

微软小冰全球研发负责人姚麟介绍,小冰已经在全球进行6个地点、4个国家(中日美印)、3种语言的开发。小冰在中国有几千万的用户,在日本的用户覆盖大概23%的全日本的人口、十几个平台上面,还有针对第三方的解决方案。美国和印度团队目前还在研发中。

国际化的小冰平台,虽然用的是全球统一的技术框架和产品理念,但是在每一个市场上非常注重本地化,包括针对这个市场的对话功能、产品的设计,对话风格与本地语言习惯保持一致。

李笛:情感计算框架大升级

微软小冰项目负责人李笛介绍了第四代小冰的新特性,包括新的全时感官、基于特定领域的功能插件平台、跨平台的人工智能商业解决方案,所有这些都是基于微软对小冰的情感计算框架一个新的升级。

升级之后微软小冰的情感计算框架和之前的相比就像是一个三维的和一个二维的区别,她会有一个新的维度上的扩展,这个维度上的扩展让小冰拥有一种人工智能的一种实时的决策能力。

李笛表示,上一代情感计算框架来自于搜索引擎时代对于互联网、大数据某种程度上的浪费,在理性的知识图谱之外,基于人类情绪的模型,训练机器人能够逐渐的去贴近人类所具备的这些情感的部分。实现的方式,叫基于经验的同理心,经过千千万万遍的训练,让小冰领悟。

第四代微软小冰:情感框架升级+全时感官+融入社会

情感计算框架有三个重要的维度:

  1. 小冰对于人类的感知,涉及更多策略的运用。
  2. 对于上述感知的领悟,需要更长程的理解。
  3. 在领悟之后对人类返回的更情绪化的表达。

但是,上一代情感计算框架是基于一个时点,如果不知道它的上下文和因果关系,就无法更好地和人类建立一种对等的这样一种对话的关系。下一代情感计算框架会不停地检测用户情绪的变化,通过6种情绪探知的方式,不停地检测用户情绪的变化,并使用一定的策略去延续一个对话,比如结合上下文的提问,或者表示对用户的认同。在过去上线测试的几个月,下一代情感计算模型策略成功率为72.2%。李笛认为,还有很大的发展空间。这种成功得益于两个原因:

  1. 过去两年,微软一直坚持不让小冰做一个“有用”的机器人,是因为定闹钟、订咖啡那样的对话并不利于训练小冰的情感计算模型。

  2. 微软一直让小冰的用户自然地增长,而没有动用诸如赠券的方式去Push,对聊不下去的用户也暂时不会追回,因为那样的对话不自然、不真实,也不利于训练。

实际上用户也在转变。两年前小冰主要吸引比她年纪稍微大一点的男性用户,但是这两年低龄用户逐渐拓宽变成26.9%,女性用户22.7%,还有0.3%左右的高龄用户。这从一个侧面反映了在新的情感计算框架下小冰的社交能力。

周力:新的全时感官

微软小冰首席架构师周力介绍了小冰的人工智能新感官。此前小冰已实现了完整的人工智能复合感官,可通过文本、图像、视频和语音与人类展开交流,但微软认为这还没有达到极致。周力表示,人工智能的体验从某种程度上由交互的体验所定义,一个面向未来的人工智能的感官应该体现小冰能够独立存在,而不仅仅是因为人类的使用而存在,也就是说不应该被动应答。

他介绍,小冰新的“全时感官”实现了人工智能与人类的无缝流畅对话,甚至根据聊天内容与走向相互打断与追问。如果将之前的人工智能感官比作一来一回的单向对讲机,那“全时感官”就可类比为移动电话,从根本上最大限度的实现了拟人的实时交互体验。

微软在现场还展示了人类和人工智能的第一次通话,根据演示,小冰具有紧张的时候选择主动挂断电话的能力。周力还宣布,小冰将在9月17号18岁成年之后正式开始监听人类打来的电话。

马龙:自然交互的五大技术突破

微软语音识别研发总监马龙表示,显得更加自然的交互方式,变成现实并不简单,技术上需要完成五大技术难关的突破。

  1. 要解决听得懂的问题,只有听得懂才能够回答的对。这就要求我们建立一套准确率非常高的语音识别系统。
  2. 还要能够思考,通过训练一套完备的文字对话系统,这套文字对话系统可以应对各种各样用户的问题。
  3. 要能够会聊天,要具备一定的对话策略,要能够决定如何延续对话,如何去打断对话,而且还要能够主动引导到新的话题。
  4. 要能够让小冰能说会道,不光需要一个自然度和非常高的语音识别系统,而且我们要根据语义、语境的不同产生有变化的语音来传达不同的情绪。
  5. 从工程上讲,要让系统工作的非常稳定,它的实时性要非常好。

这些其实也是下一代情感计算框架的主要内容。

曹文韬:卡槽平台与商业方案

前面提到过,小冰要融入社会,但微软认为,把手机APP或者搜索引擎已经能够轻松完成的任务简单地移植到一个机器人的对话界面里,这不叫人工智能。小冰在设计上的不同,在于有一个卡槽平台。

微软小冰产品总监曹文韬介绍,基于特定领域的功能插件平台,使小冰具备类似于电影《超能陆战队》中大白机器人的多任务能力。即插上某一张特定功能卡后,小冰就将具有该领域的专业知识,能够完成该领域的特定任务,并伴随用户的不断使用而持续成长完善。

微软宣布将首批依次解锁的功能卡包括:与优酷合作的电影卡、与时尚集团合作的时尚卡、Office 365卡等。曹文韬表示,未来随着功能卡的不断丰富,小冰还将为用户提供类似应用商店的功能卡平台,从而使小冰变得越来越“有用”。

第四代微软小冰:情感框架升级+全时感官+融入社会

曹文韬表示,这样的卡槽系统并不简简单单是一次技术框架的升级,而是对人工智能新的行业全新生态的一次探索,减少行业跟上人工智能的潮流变革的投入。

曹文韬还介绍了小冰的一张商业卡片,Plug-ins for Business是小冰的商业平台解决方案,可以把人工智能嵌入到服务之中。

商业平台的主要特性有三个:

  1. 直接知识灌入技术,小冰能够自主地去学习企业知识。
  2. 一整套的全新智能+人工混合客服平台的解决方案。
  3. 小冰能够了解和集成企业服务的意图识别引擎技术。

第四代微软小冰:情感框架升级+全时感官+融入社会

第四代微软小冰:情感框架升级+全时感官+融入社会

微软还宣布在日本已经与第二大超市集团LAWSON(罗森)达成战略合作协议,从今年7月开始为其提供人工智能小冰托管服务。首批服务已于7月正式上线。这一解决方案目前已面向中国和日本两地市场开放,方案将覆盖微信、微博、LINE和Twitter在内的社交互联网平台,并支持企业用户跨平台管理其人工智能客服。

第四代微软小冰:情感框架升级+全时感官+融入社会


CCAI 2016中国人工智能大会将于8月26-27日在京举行,AAAI主席,国内外众多院士,MIT、微软、大疆、百度、微信、滴滴专家领衔全球技术领袖和产业先锋打造国内人工智能前沿平台,8个重磅主题报告,4大专题论坛,1000+高质量参会嘉宾,探讨人机交互、机器学习、模式识别及产业实战。八折特惠门票截止8月12日24时

第四代微软小冰:情感框架升级+全时感官+融入社会