本篇文章861字,读完约2分钟
2016年9月13日,美国当地时间,国际多声道语音分离与识别比赛(谐音)组委会宣布了在美国旧金山的谷歌公司举行的第四届谐音-4比赛的结果:HKUST·讯飞在此次谐音比赛的三个项目中都获得了最佳成绩。这三个项目是六麦克风、双麦克风和单麦克风场景中的语音分离和英语识别任务。赢得编钟比赛再次证明了IFlytek在语音识别和多麦克风阵列语音信号处理领域的国际领先技术实力,也表明IFlytek在中文语音识别系统中保持绝对领先地位,同时其英文语音识别系统也达到了国际领先水平。
2011年,由法国计算机科学与自动化研究所、英国谢菲尔德大学、美国三菱电子研究实验室和其他知名研究机构发起的“多源环境下的计算听觉”竞赛开始了。本次比赛的目的是希望学术界和工业界针对高噪声和混响影响下的实际场景提出新的语音识别解决方案,从而进一步增强语音识别的实用性和通用性。在国际语音识别评估中,这是一场艰难的比赛。目前,编钟大赛已经举办了四次,已经成为业界最具影响力、团队数量最多、多通道噪声鲁棒性最高的语音识别大赛。此前的参赛队伍包括英国剑桥大学、美国卡内基梅隆大学、日本ntt、德国亚琛工业大学等著名研究机构,以及清华大学、中国科学院音系研究所、上海交通大学等国内著名大学和研究机构。本次编钟比赛由谷歌主办,谷歌也安排了相关人员参加比赛。
科大讯飞今年第一次参加这项比赛。通过与中国科技大学杜俊教授、西北工业大学陈敬东教授、佐治亚理工学院李金辉教授等国内外知名专家团队的深入合作和讨论,该项目获得了三个项目的桂冠,并在每个项目的历史上都创造了新的记录。iFlytek在六麦克风场景中创造的2.24%的单词错误率记录得到了竞赛组织者的高度赞扬,他们认为iFlytek的系统为基于多通道中小词汇量的复杂场景语音识别任务提供了近乎完美的解决方案。这是HKUST讯飞在语音合成、说话人识别、语言识别、机器翻译和认知智能等领域获得国际评价后的又一全新成果。
以下是第四届国际比赛三个项目的详细结果(单词错误率越低,系统性能越好):
[请点击结果页面]