bifa必发唯一官网主页·尖端语音辨认专家Daniel Povey：新一代Kaldi可大幅下降收听语音词错误率年末或将应用于一切小米AIoT产品

2021-09-10 15:24:22 来源：必发bf88官网作者：必发bf88官网登入 41

分享到：

　　中国网科技8月31日讯小米集团语音首席科学家、“Kaldi之父”Daniel Povey(丹尼尔·波维)今天承受媒体采访时称，新一代Kaldi方针不仅仅是赶上或许略微抢先这些语音辨认库，而是要根本地改动语音辨认的完结方法。

　　Daniel Povey对中国网科技泄漏，现在小米AIoT产品中还用的是第一代Kaldi，接下来小米将逐渐把新一代Kaldi才能融入到小米产品中，估计在今年年末或明年初，开端将新一代Kaldi才能应用于小米产品，但现在仍在测验之中。

　　谈及为何挑选在小米开发新一代Kaldi，Daniel Povey对记者直言：“现实上有许多大型互联网公司都想把我引起麾下，但小米是一家公司战略规划相对安稳的公司，加上表现出对开源项目的许诺与注重，因而在我需求做开源项目这一硬性规范看来，小米是最佳去向。”

　　据悉，现有端到端语音辨认模型的盛行和准确率的逐渐提高，以及PyTorch、TensorFlow等深度学习东西包的遍及，是开发新一代Kaldi首要动力。相较初代而言，新一代Kaldi是一个全新代码库，需求彻底从头打造，由C++以及CUDA完结，并能够在Python调用。新一代Kaldi由3个独立的项目组成，别离称为 k2、Lhotse和Icefall。

　　其间，最新算法Icefall是这次新一代Kaldi重要部分，根据完结“双向建模”和多层模型的优势，具有新一代Kaldi才能的AIoT产品能够大大提高语音辨认才能，然后下降收到语音指令的词错误率。小米集团方面称，现在已经在LibriSpeech数据集上取得了2.57%的词错误率，而且还在继续的进一步优化。

　　Daniel Povey表明：“新一代Kaldi与PyTorch兼容，而且代码更简单修正，比初代Kaldi代码库更灵活得多，答应用户更轻松地测验新主意。而且止于现在，依托于Kaldi而发展起来的许多中小型企业有许多，Kaldi将一向坚持做项目开源。”

　　揭露信息显现，Daniel Povey是语音辨认开源东西Kaldi的首要开发者和维护者，因而被称为“Kaldi之父”。而Kaldi东西简而言之的讲，现在国内三大语音帮手小爱同学、小度、天猫精灵运用的底层结构都是Kaldi，Kaldi等于是能让智能物联经过语音交互方法出现的根底，是现在被业界公认的语音辨认结构柱石。

bifa必发唯一官网主页·尖端语音辨认专家Daniel Povey：新一代Kaldi可大幅下降收听语音词错误率年末或将应用于一切小米AIoT产品上一篇：构建下一代ASR：语音情感辨认运用程序下一篇：新一代Kaldi将应用于小米多款产品改动许多语音辨认方法

手表

bifa必发唯一官网主页·尖端语音辨认专家Daniel Povey：新一代Kaldi可大幅下降收听语音词错误率 年末或将应用于一切小米AIoT产品

bifa必发唯一官网主页·尖端语音辨认专家Daniel Povey：新一代Kaldi可大幅下降收听语音词错误率年末或将应用于一切小米AIoT产品