PRODUCTS
中国网科技8月31日讯 小米集团语音首席科学家、“Kaldi之父”Daniel Povey(丹尼尔·波维)今天承受媒体采访时称,新一代Kaldi方针不仅仅是赶上或许略微抢先这些语音辨认库,而是要根本地改动语音辨认的完结方法。
Daniel Povey对中国网科技泄漏,现在小米AIoT产品中还用的是第一代Kaldi,接下来小米将逐渐把新一代Kaldi才能融入到小米产品中,估计在今年年末或明年初,开端将新一代Kaldi才能应用于小米产品,但现在仍在测验之中。
谈及为何挑选在小米开发新一代Kaldi,Daniel Povey对记者直言:“现实上有许多大型互联网公司都想把我引起麾下,但小米是一家公司战略规划相对安稳的公司,加上表现出对开源项目的许诺与注重,因而在我需求做开源项目这一硬性规范看来,小米是最佳去向。”
据悉,现有端到端语音辨认模型的盛行和准确率的逐渐提高,以及PyTorch、TensorFlow等深度学习东西包的遍及,是开发新一代Kaldi首要动力。相较初代而言,新一代Kaldi是一个全新代码库,需求彻底从头打造,由C++以及CUDA完结,并能够在Python调用。新一代Kaldi由3个独立的项目组成,别离称为 k2、Lhotse和Icefall。
其间,最新算法Icefall是这次新一代Kaldi重要部分,根据完结“双向建模”和多层模型的优势,具有新一代Kaldi才能的AIoT产品能够大大提高语音辨认才能,然后下降收到语音指令的词错误率。小米集团方面称,现在已经在LibriSpeech数据集上取得了2.57%的词错误率,而且还在继续的进一步优化。
Daniel Povey表明:“新一代Kaldi与PyTorch兼容,而且代码更简单修正,比初代Kaldi代码库更灵活得多,答应用户更轻松地测验新主意。而且止于现在,依托于Kaldi而发展起来的许多中小型企业有许多,Kaldi将一向坚持做项目开源。”
揭露信息显现,Daniel Povey是语音辨认开源东西Kaldi的首要开发者和维护者,因而被称为“Kaldi之父”。而Kaldi东西简而言之的讲,现在国内三大语音帮手小爱同学、小度、天猫精灵运用的底层结构都是Kaldi,Kaldi等于是能让智能物联经过语音交互方法出现的根底,是现在被业界公认的语音辨认结构柱石。