众所周知,语音识别属于人工智能学科的模式识别研究范畴。那么语音识别的发展现状和未来发展前景和方向是什么呢?
语音识别的发展现状。
简单的语音识别,近年来最大的变化是从hybrid到端到端。如果kaldi将各大公司的语音识别速度提高了10年,端到端进一步降低了学习识别算法的门槛。据我所知,目前很多性能都被端到端模型刷了(详见espnet论文和github目录)。但是,如果应用于企业端,一些公司仍然坚持hybrid的位置。另一方面,这一领域也强烈依赖数据。大公司的识别api都是用10万级语音训练的,所以作为初创公司,很容易因为数据问题而卷死。
语音识别的发展前景。
作为人机交互的桥梁,对着陆有着强烈的需求,这是各大公司所需要的。但最近国家战略不太重视(毕竟天天吹超过人的转写能力,还有什么好研究的)。除非你能进入一个小圈子,否则建议转到其他地方。
语音识别的发展方向。
1、端到端,特别是基于transformer的解码速度、内存占用、在线和离线性能差距,时间对齐仍需解决。
2、小资源,在有预训练模型的情况下,能否像语言模型一样快速自适应小语种数据集。
3、多语种联合建模,尤其是中英混合语音。
4、更快的适应当前场景环境,满足场景智能需求。
5、智能识别回话场景,智能回复语言所表达需求。
成都融和实业排队叫号系统厂家(www.iritqq.com)是一家集研发、生产、营销、服务于一体的高新技术企业.主营智能填单系统、智能查询系统、智能排队叫号系统、医院分诊系统、排队机、叫号机、评价器(好差评系统)、呼叫器、多媒体查询及信息发布配套系统等,公司产品已广泛应用于不动产登记、智慧医疗、智慧税务、智慧政务、智慧金融、智慧通讯、智慧服务大厅、智慧机关单位等服务窗口行业.咨询电话:028-87438905。
标签:智能语音,语音识别,智能识别