科大讯飞真的是全球语音识别冠军吗？NO

发布时间：2024/7/27 12:00:05 阅读次数：2352

继乐视网官网N大生态的室息式梦想破灭后，科大讯飞做为A股中稀有的比较高品质的科技有限公司，依靠“人工智能技术”定义的火爆，总市值一度超出1000亿元。历经销售市场的总体一波下滑，科大讯飞2019年10月23日的总市值仍有485亿人民币。比照得话，而同一人才梯队的另一家在赴美上市的搜狗搜索的总市值则仅有23.7亿美金（折合165亿人民币）。点评一个互联网企业，说到底是看技术性，这早已是一个基础的共识。一样，怎样宣扬自身的技术实力，并得到销售市场的认同也是上市企业的一项必需课程。以语音识别技术为关键技术的科大讯飞，经常在宣传策划及其销售业绩公示中谈及企业在一系列国际性技术性赛事中得冠，比如语音识别赛事BlizzardChallenge、设备阅读题争霸赛StanfordQuestionAnsweringDataset、自然语言理解了解行业权威性争霸赛SQuAD等，那麼这种看上去十分高端大气的赛事到底是什么东东？科大讯飞真的是世界大赛吗？

科大讯飞的2019年中报是那么叙述的：“在人工智能技术行业，科大讯飞拥有诸多开拓性提升。语音识别技术性持续13年卫冕全球英文语音识别比赛（BlizzardChallenge）第一，2013年在全世界唯一超出真人版音标发音水准”，17年的年度报告则是那样叙述的：“2007年迄今，持续十二年卫冕国际性最大水准的语音识别赛事（BlizzardChallenge）全世界第一，是全世界唯一在英语生成上超出真人版音标发音水准的系统软件”。

趣味的是，在网上一篇名为“搜狗搜索得到BlizzardChallenge2018语音识别比赛总冠军”的文章内容写到，“前不久，在不久落下帷幕的BlizzardChallenge2018语音识别比赛上，来源于我国的新势力团队搜狗公司初次比赛，就一举击败众多国际性顶级科研院所，得到了可懂度和视频语音间断二项每日任务中排名第一的优异的成绩。”好像和科大讯飞撞了车。

假如在百度上搜BlizzardChallenge，主页中有一大半是科大讯飞的新闻稿件。只能在Bing英语版上搜，才可以寻找此项“赛事”的官方网站。实际上，这一网址乃至不可以称作官方网站，由于这一CMUSpeechGroup（英国卡内基梅隆高校语音识别技术研究组）十分质朴的网页页面上，既沒有领导干部和知名人士展位，都没有一切商业服务和比赛特性的宣传策划。了解学术圈的学生们一眼就可以看出去，这是一个规范且十分普遍的学术网站设计风格。

这一网址乃至沒有Aboutus，对Blizzard的表明也仅有简易的一段话：

Inordertobetterunderstandandcompareresearchtechniquesinbuildingcorpus-basedspeechsynthesizersonthesamedata,theBlizzardChallengehasbeendevised.Thebasicchallengeistotakethereleasedspeechdatabase,buildasyntheticvoicefromthedataandsynthesizeaprescribedsetoftestsentences.Thesentencesfromeachsynthesizerwillthenbeevaluatedthroughlisteningtests.

汉语翻译回来便是：以便更强的了解和比照在同样数据信息上搭建根据词库的语音识别技术性，大家建立了BlizzardChallenge。基础的挑戰全过程是应用公布的视频语音数据信息，从数据信息中生成视频语音，生成特定的检测句子。每一个合成器转化成句子的实际效果会根据听测的方法来点评。

从BlizzardChallenge的往年汇报中能够看得出，此项起源于2006年的主题活动最开始由CMU机构举行，近几届（2016-2018）则由爱丁堡学校来机构，一些年代的研讨会递交到Interspeech本年度交流会或是Workshop中。

从科大讯飞的“比赛”状况看，科大讯飞能够说成此项主题活动的“老湿机”了，2007年第二届主题活动中就出現了中国科技大学（USTC）的姓名，2010年起，则出現iFlytekSpeechLab（科大讯飞语音实验室）和中国科技大学（USTC）的协同落款，近几届则有科大讯飞和國家工程项目试验室等组织的协同落款，坚信这种成效的身后全是同一批精英团队。

从别的“参赛选手”的状况看，往年报名参加結果点评的都大概有十余个精英团队，2019年为10个，17年则为13个。2019年的比赛精英团队如下图图示（图上前五个是标准方式benchmark和真正人工语音，没有上述情况的10个参赛选手之列），比较著名的有CMU（卡内基梅隆）、Edinburgh（爱丁堡学校）、USTC（中国科技大学）、搜狗公司，别的则为来源于全世界各地区的高校精英团队。17年的比赛精英团队中，比较著名的有CMU（卡内基梅隆）、Edinburgh（爱丁堡学校）、USTC（中国科技大学）、Cambridge（牛津大学）、阿里巴巴网，趣味的是阿里巴巴好像从没报导过本次“比赛”，也许是“考试成绩”不佳吧。

BlizzardChallenge的主办单位每一年都是刊登一篇小结文章内容，题型为“TheBlizzardChallenge+年代。”融合小结文章内容，能够看得出BlizzardChallenge是一个在语音识别技术行业持续很多年的、很非常好的学术交流，由电子信息科学行业的肯定权威性CMU和爱丁堡学校精英团队进行，认可度显而易见。可是为此做为技术性的宣传策划，是另当别论的：

（1）Challenges一词虽然能够汉语翻译为“XX比赛”，可是BlizzardChallenge这类学术交流，数最多是一种争霸赛的特性，并非互相PK。交流会的服务宗旨早已写的十分清晰，“tobetterunderstandandcompareresearchtechniques”，科学方法论和技术性的较为至关重要，并非只是是去PK一些“考试成绩”。实际上，在主办单位往年的个人总结中，也从没去说哪个“参赛选手”是“总冠军”，而大量的是去阐述每家递交的方式在数据上的整体主要表现。个人总结中的“Results”章节目录，也从没有显著选择性的去描述哪样技术性更强，在TheBlizzardChallenge2018一文的Results中乃至彻底沒有提科大讯飞（见下面的图）。即便确实有一些较为，那也是好多个主要参数的比照，在这类状况下，讯飞和搜狗搜索自封为“总冠军”，确实是一些浮夸了。

2）BlizzardChallenge从没称自身为全世界比赛，其“参赛选手”关键以大学的科学研究精英团队主导，总数也并不是很多，每一年只能十家上下，里边既沒有Microsoft，google，IBM这种喜爱在顶尖大会刷文章内容的一线科技有限公司，都没有百度搜索、腾迅等中国大佬。若树立自身是说白了的“联全球英文语音识别比赛”总冠军，在所难免造成欺诈，令阅读者觉得它是一项业内普遍参加的PK比赛，实际上是他人没报名参加罢了。

（3）BlizzardChallenge是在一样数据上持续做测验的比赛，并不是实际真正情境，信息量也算不上很大，并且其数据信息的內容显示英文，科学研究过自然语言理解的同学们了解，一样的技术性在不一样的语料库上通常会出现不一样的主要表现，因而在这类比赛上的并不可以表明一切难题——终究科大讯飞的业务流程都会中国。

依据：宣传策划上的浮夸之嫌并不可以证实科大讯飞的技术性不太好，可是技术性企业還是必须更为不张扬实干一些，终究它是一场没什么业内巨头报名参加的“赛事”，而技术性积累要远超科大讯飞的搜狗市值才只能讯飞的三分之一。

[1]