Amazon Alexa系列介绍(2)--AVS设计指南

时间:2024-03-27 22:57:06

Alexa用户期望获得熟悉的用户体验。使用如下的设计和实现指南可以让AVS集成满足用户的预期。 
Application Examples:确定产品因素,选择用户怎样与Alexa交互。 
有两个方式启动与Alexa的交互:接触和声音。接触方式依赖一个物理控制,比如遥控器或Amazon Tap,语音方式使用唤醒词“Alexa”,比如Amazon Echo。下面列出典型的应用案例,分别通过按键启动交谈、敲击启动交谈、声音唤醒词启动交谈。 
Amazon Alexa系列介绍(2)--AVS设计指南

ASR(Automatic Speech Recognition) Profile Selection:确定最好的自动语音识别模式。Alexa使用自动会话识别(ASR)和自然语言理解(NLU)的组合来理解用户的语音并精确反馈。ASR将语音转成文字,NLU将文字转换成指令。最后Alexa发送指令到对应的产品,执行某个具体的操作,比如播放音乐。 
对应于不同的产品、形状、声学环境和应用场景,AVS提供三种ASR模式。模式参数在每个“识别事件(Recognize event)”消息负载中发送给Alexa,并且也用于显示用户语音的结束是由客户端确定还是由云端来确定。(怎样确定语音结束被成为语音终点检测(speech endpointing))典型的ASR模式如下图所示: 
Amazon Alexa系列介绍(2)--AVS设计指南

**Hardware and Audio Algorithms:**review技术指标,使语音识别最优化。正确的硬件配置和音频处理算法可以提高产品的声音唤醒的灵敏度,对于有音乐播放和嘈杂背景的产品设计更是如此。下表列出了典型的硬件配置要求。 
Amazon Alexa系列介绍(2)--AVS设计指南 
噪声抑制(Noise Reduction)、回声消除(AEC)、波束成形(Beamforming)是声音处理方面的通用技术,参见声音处理相关的技术文档。

Third-party Resources:了解硬件和软件解决方案供应商。下面列出典型的唤醒词和音频处理系统的第三方供应商。请参考制造商的产品信息确保满足设计需要。 
Amazon Alexa系列介绍(2)--AVS设计指南