首页  中心介绍  语言业态信息  语言科技信息  一带一路政策  一带一路人文  一带一路论坛  学术研究  大数据  在线智库 
当前位置: 首页>>一带一路>>语言业态信息>>语言服务产业>>语言成品产业>>正文
谷歌开源Live Transcribe语音识别转文字工具
2019-08-18 17:01  

中关村在线消息:谷歌在其开源博客中宣布开源Android语音识别转录工具——Live Transcribe的语音引擎,它可以将语音或对话实时转录为文字,还能够为听障人士提供帮助。

Live Transcribe 是谷歌于今年2月推出的一款Android应用程序,它的语音识别由谷歌最先进的Cloud Speech API提供。但是,依赖于云引入了一些复杂性,不断变化的网络连接、数据成本和延迟等等都带来一些考验。因此,谷歌把它开源出来,希望开发人员在已有的基础上进一步构建和开发。

Cloud Speech API目前无法支持无限的音频流,团队采取了一些措施来解决这一难题,例如在达到超时之前关闭并重新启动流式传输请求,这将有效减少会话中丢失的文本量。

值得一提的是,Live Transcribe支持超过70种语言,并能够根据语音自动识别语种,其中也包括中文。

另外,由于是提供实时语音转录,转录出来的文本会随着语音的输入不断发生变化,降低延迟自然十分必要。该引擎能够大大降低延迟率,这都要归功于它的自定义Opus编码器。

--------------------------------------------------

[声明]本站系本网编辑转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容,本站文章版权归原作者所有,内容为作者个人观点,本站只提供参考并不构成任何投资及应用建议。本站拥有对此声明的最终解释权。

 
 

Copygight 2016 by Collaborative Innovation Center for One Belt One Road Language & Culture Service All Rights Reserved
版权所有:“一带一路 ”语言文化服务协同创新中心        制作:吉林外国语大学信息技术中心