“远场识别”是什么?神奇的“麦克风阵列”又是什么?本文来自微信公众号:KnowingAI知智(ID:Knowing_AI),作者:虞喵喵。
对着手机讲话识别效果很好,可是距离远一点,再离远一点呢?
距离一旦拉远,收音效果就不理想。
如果是在封闭的环境中,还会形成混响。
周围有噪音,或是设备自己正在播放音乐,还要解决噪声问题……
在这样的中远距离环境中发生的语音识别,被称为远场识别(Far-field Speech Recognition)。
通常我们会使用“麦克风阵列”解决远场识别问题。
“麦克风阵列”由两个以上的麦克风组成,直线、环形或是球状,布置方法各不相同。
通过彼此之间的距离差所造成的接收到的声波差异,可以了解声源的位置定向增强,从而提升收音效果;
同时抑制其他方向的“声音”,来解决房间混响和噪声问题。
除了硬件,语音识别模型往往使用近场语音数据训练而成。如果替换成远场数据重新训练,也能提升识别效果。
除了依靠麦克风阵列,也有纯粹依靠深度学习算法解决问题的流派,不过目前大部分智能音箱都在使用麦克风阵列。
相关推荐
机器也有“顺风耳”
机器也有烦恼,需要“做梦”来忘掉
AI也有偏见:你在机器“眼里”是好人还是坏蛋?
从“机器儿童”到“机器学习”:“学习”的概念是如何变化的?
少数派的未来猜想 | 旧机器再见,新机器你好
组装iPhone,富士康工人比机器好多了
当机器与宋代诗人PK写诗,谁赢了?
机器如何鉴别黄色图片?
机器是如何被骗并骗人的?
A16Z合伙人:发展智能家居与机器学习的新思路
网址: 机器也有“顺风耳” http://m.xishuta.com/newsview1951.html