作为中国语音交互人工智能领域的领先者,思必驰是国内唯一拥有人机对话技术,国际上极少数拥有自主产权、中英文综合语音技术(语音识别、语音合成、自然语言理解、声纹识别、性别及年龄识别、情绪识别等)的公司之一。思必驰于业内率先推出多轮对话、可纠正可打断的认知智能、实时转录的语音输入板、环形6+1远场麦克风阵列、AIOS-思必驰对话操作系统。
“环形六麦阵列”人性化的语音交互技术
环形六麦阵列是在“环形6+1远场麦克风阵列”基础上全面升级的一项语音交互技术。主要针对智能家居和智能机器人提出的软硬一体化解决方案。支持回声消除、声源定位、波束成形、语音增强等功能。同时,思必驰提供云端第三方内容服务,让大数据精准服务于智能语音领域。
1、语音增强:
解决噪声环境下的识别问题需要从抑制噪声和语音增强两方面入手。思必驰环形六麦阵列利用拾音波束成形,采用独特算法,有效抑制波束之外的噪声,同时融合语音信号的空时信息,从含噪声的语音信号中提取出纯净语音,有效地增强说话人语音。
2、声源定位:
思必驰环形六麦阵列实现360°环形拾音,多麦定向,准确计算目标说话人的角度和距离,实现对目标说话人的跟踪以及语音定向拾取,精准度控制在±10°以内。声源定位功能不限制说话人运动,不需要移位操作,这增强了产品设计的灵活性和功能的多样性,可有效地实现对产品的多功能辅助作用。
3、远场交互:
思必驰环形六麦阵列在前端充分利用其空域滤波特性,抑制拾音波束外的回声、混响等噪声,进行语音增强处理,辅之以语音识别引擎的二次处理,实现优质的远场识别交互。思必驰已实现了国内领先的5米远场交互,5米、3米、1米识别率分别为92%, 94%, 96%以上,远场识别媲美近讲。
4、打断纠错:
思必驰环形六麦阵列融入了自适应、理解纠错、智能反馈等认知技术,重新提取大数据因素,并进行二次计算,实现智能纠正打断,能够适应更多的应用环境,具有进化调整功能,从而在人机交互的过程中,使机器更“听话”。
5、多轮对话:
基于对话逻辑,允许人机进行多轮语音互动,让机器理解用户的深层意图并提供反馈。而机器可以通过深度学习,可以根据上下文语境准确追踪用户意图,并随着数据的积累而越发灵活精准流畅。
6、后端服务:
目前思必驰环形六麦阵列解决方案整合了高德地图、酷我音乐、虾米音乐、喜马拉雅电台、考拉电台、大众点评等生活服务方面的诸多关键资源,致力将智能语音服务整合成一体化产品,打造体验闭环,形成完整的生态链。
环形六麦阵列推动了智能机器人、智能家居等领域便捷化的发展,淘汰按键、遥控器、APP等控制终端,实现纯语音控制的未来便捷生活。促进了智能语音交互技术的发展,有利于未来智能人机交互的多模态结合和人工智能整个行业的发展。
在本次5月18号、19号于北京举办的第五届国际服务机器人千人大会上,思必驰将携带最新科研技术“环形六麦阵列”出席峰会。思必驰CMO龙梦竹女士也将在高端对话环节亮相。究竟“智能语音能否成为人工智能交互最天然的手段”,让我们在大会上一见分晓吧!