本篇文章457字,读完约1分钟
近日,微软首席语音科学家黄在论文中表示,他们实现了技术突破,在最近的行业标准总机语音识别基准测试中,单词错误率(wer)低至6.3%,比ibm上周达到的6.6%低0.3%,达到了目标语音识别领域的最低错误率水平。
黄在论文中提到:
我们最好的单一系统在nist 2000交换机上已经达到了6.9%的错误率。我们相信这是目前单一系统所能达到的最佳性能。在总机的测试数据上,多种语音模型的结合将进一步降低误词率至6.3%。
微软表示,人脑的生物运作原理启发微软开发深层神经网络来实现这一突破。此外,他们还提到了计算网络工具包(cntk)的深度学习算法对这一技术突破的影响,以及gpu集群对这一进步的贡献。微软指出,cortana可以同时吸收十倍以上的语音数据。
微软的语音识别技术相对成熟。在不断突破语音识别基础技术的前提下,继续完善基于语音识别技术的各种应用服务,包括cortana和skype翻译,使人与机器的互动更加自然。
相关阅读:
秘密:微软想用聊天机器人取代应用?
人工智能浪潮下语音识别建模技术的演进