刘聪:科大讯飞直播场景下识别准确率已达85%

站长之家(ChinaZ.com)10月23日 消息:今天下午,科大讯飞AI研究院常务副院长刘聪发表了关于“构筑AI科技树,焕新美好新生活”的主题演讲。在演讲中,刘聪提到了如何保持AI技术不断突破以及如何实现应用落地的问题。

刘聪认为,在人工智能的应用场景中,最重要的一个就是语音交互。他称语音识别是讯飞的传统强项。近年来,科大讯飞陆续推出了方言识别、远场交互、多麦克风阵列等相关的功能,将语音听写从简单场景的可用做到了通用。

下一步,科大讯飞将持续深耕语音识别,去挑战更加复杂的场景,去实现从语音到声音,从单纯的文字内容的识别,到音频的全场景解析。例如直播场景这样有游戏、音乐以及笑声、掌声等各种音效嘈杂的背景下,如何有针对性地提取想要的声音。

面对这种复杂的环境,科大讯飞已经有一套全场景音频解析的整体方案。目前,可达讯飞在直播场景下的识别准确率已经从从60%提到了85%。未来,这些相关技术会在科大讯飞的开放平台、讯飞听见等上线。

免责声明:因为源码和模板等程序的特殊性,安装或者部署的同时需要一定的技术知识,请自行安装调试,本站不能所有提供的资源都提供安装帮助的,如遇到相关问题请自行解决,本站不提供退款和相应的免费解答服务!如有版权问题请联系QQ:2041966102 进行反馈PTcms、KYcms资源分享③
CMSbug- » 刘聪:科大讯飞直播场景下识别准确率已达85%

提供最优质的资源集合

立即查看 了解详情