语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到年深度学习技术的长足发展才使得语音识别的精度大大提高,虽然还无法进行无限制领域、无限制人群的应用,但也在大多数场景中提供了一种便利高效的沟通方式。
语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别是一门涉及面很广的交叉学科,它与声学、语音学、语言学、信息理论、模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
语音识别按任务难度分为面向人机对话的语音听写和面向人人对话的语音转写。得益于上述深度学习技术的不断突破,语音听写技术已广泛在语音输入、语音搜索、语音助手等产品中得到应用并日臻成熟。但是,在语音识别的行业应用中,更多的是面向人人对话的场景,例如在会议、采访、授课等场景下,语音识别将面临说话风格、口音、录音质量等诸多方面的挑战。同时,由于人人对话语言的无组织性,即使在语音识别正确率非常高的情况下,语音识别文本的可阅读性仍然存在较大的问题,需要对口语化文本进行分句、分段及流利性做后处理工作,才具有可阅读性。
语音是人类沟通和文化传承的基础。近年来,语音识别的行业应用发展为从业者描绘了一个美好的蓝图,中国仍然需要根据语音识别技术的演进规律加大研发力度,培养人才,拓展市场,继续引领语音识别的行业应用,成为语音识别技术的全球领跑者。
转载请注明:http://www.0431gb208.com/sjszlff/1553.html