PRODUCTS
近来,网易有道在语音研讨范畴尖端峰会INTERSPEECH 2021上的儿童语音辨认竞赛 ETLT 2021上荣膺英语敞开赛道和关闭赛道两项榜首。INTERSPEECH是由世界语音通讯协会ISCA安排的语音研讨范畴的尖端会议之一,是全球最大的综合性语音信号处理范畴的科技盛会。作为年度一次的语音界盛会,全球很多语音范畴以及人工智能范畴的闻名学者、企业以及研制人员都会前往出席会议。
据悉,此次竞赛的赛题是解决非母语儿童语音辨认问题。因为儿童语音天然生成的差异性,包括生理差异(如儿童声道长度较短)、认知差异(如言语习得水平较低,常呈现语法逻辑过错、发音前置过错、发音不完整和语种稠浊等状况),以及行为差异(如儿童习气低声私语)等,导致通用语音辨认模型难以适配,这就让非母语儿童语音辨认体系的构建更具挑战性。另一方面则对错母语儿童语音的数据资源较为稀缺,使得惯例声学建模办法在该场景下很难见效。
网易有道团队凭仗在多年对ASR(主动语音辨认Automatic Speech Recognition)技能研制以及实践教育场景中堆集的丰厚经历,充沛结合儿童语音在生理特征及言语认知方面的特殊性,取得了英语敞开赛道和关闭赛道两项榜首。其间,关闭赛道中的首要难题在于如安在非英语母语儿童语音数据稀缺的状况下取得优异的辨认作用;而敞开赛道则聚集于怎么有用地将很多的成人语音数据迁移到儿童语音辨认模型操练中。从数据中不难看出,网易有道能够面临杂乱的环境下有超卓体现,在很多竞争对手中锋芒毕露取得大奖,无疑是对有道在ASR技能研制及使用范畴的认可。
此次网易有道的获奖并不意外,在 2020年 INTERSPEECH口音英语语音辨认挑战赛中,有道研讨人员提交的体系在口音辨认使命中就排名第二。有道的吴昊、王海魏等人,仅预备了十天时刻就在口音品种辨认和英语语音辨认两个赛道上取得了第二名、第三名的好成绩。
有业内人士表明,比较打竞赛,一项技能的工程落地是个长时间进程。而网易有道的这支语音团队一向秉承着以技能落地为导向,以用户反应为目标。
网易人工智能对语音辨认技能(ASR)的研讨开始于2014年。现在,网易有道K12教育范畴上有许多儿童语音辨认方面的使用,例如有道乐读,有道精品课等。其间,有道乐读的在线教育进程中,通过ASR技能,儿童可进行语音互动答题,不用进行手动挑选答案。而有道精品课在高中语文课程中,则上线了“智能背诵方案”功用,通过AI辨认语音中的讹夺内容,并给予完成度打分,学生能够依据自己的学习节奏进行有用操练。通过测验,有道语音辨认技能在一些场景上辨认准确率超越98%,不止支撑中文、英文,还支撑日、韩、法、德等多种言语。
近年来,以翻译技能发家的有道,在AI年代攻坚神经网络翻译技能(NMT),现在其NMT准确度已达到世界领先水平;作为主力技能之一的OCR辨认技能,现已能支撑26种干流言语文字,是现在国内辨认言语最多的OCR辨认引擎。有道在AI范畴除了不断更新迭代的有道词典笔等硬件产品,有道精品课、有道词典等产品上也使用了语音辨认、白话打分、AI作文修改等智能技能。只要有契合市场需求的技能才能在一代代产品的安稳推出中,厚实生根。