PRODUCTS
:谷歌在其开源博客中宣告开源Android语音辨认转录东西——Live Transcribe的语音引擎,它能够将语音或对话实时转录为文字,还能够为听障人士供给协助。
Live Transcribe是谷歌于本年2月推出的一款Android应用程序,它的语音辨认由谷歌最先进的Cloud Speech API供给。可是,依赖于云引入了一些复杂性,不断改变的网络连接、数据本钱和推迟等等都带来一些检测。因而,谷歌把它开源出来,期望开发人员在已有的基础上进一步构建和开发。
Cloud Speech API现在无法支撑无限的音频流,团队采取了一些办法来处理这一难题,例如在到达超时之前封闭并重新启动流式传输恳求,这将有用削减会话中丢掉的文本量。
值得一提的是,Live Transcribe支撑超越70种言语,并能够依据语音自动辨认语种,其间也包含中文。
别的,由所以供给实时语音转录,转录出来的文本会跟着语音的输入不断发生改变,下降推迟天然十分必要。该引擎能够大大下降推迟率,这都要归功于它的自定义Opus编码器。
本文归于原创文章,如若转载,请注明来历:谷歌开源Live Transcribe语音辨认转文字东西/724/7246779.html
中关村在线音讯:谷歌在其开源博客中宣告开源Android语音辨认转录东西——Live Transcribe的语音引擎,它能够将语音或对话实时转录为文字,还能够为听障人士供给协助。谷歌开源Live Transcribe语音辨认转文字东西Live Transcribe是谷歌于本年2月推出的一款A...