本文为PMCAFF专栏作者rui_liu出品
语音交互将会成为新的入口,也是各大公司务必争夺的资源之一,资源是指数据,不是技术,因为技术会开放,而有价值的有标注的数据才是制胜法宝。
所以,pm们需要了解语音识别技术的基础,总有一天你会用到,并且这一天不会太远。
我会从以下几个方面介绍语音识别:
语音识别的基础概念
1
概念
自动语音识别(AutomaticSpeechRecognition,ASR)技术是一种将人的语音转换为文本的技术。
这项技术被当做是可以使人与人、人与机器更顺畅交流的桥梁,已经在研究领域活跃了50多年。
2
发展
ASR在近几年的流行,与以下几个关键领域的进步有关:
摩尔定律持续有效:使得多核处理器、通用计算图形处理器GPGPU、CPU/GPU集群等技术,为训练复杂模型提供了可能,显著降低了ASR系统的错误率。大数据时代:借助互联网和云计算,获得了真实使用场景的大数据训练模型,使得ASR系统更具鲁棒性(健壮性、稳定性)。移动智能时代:移动设备、可穿戴设备、智能家居设备、车载信息娱乐系统,变得越来越流行,语音交互成为新的入口。
3
研究领域分类
根据在不同限制条件下的研究任务,产生了不同的研究领域。如图:
4
识别任务分类
根据不同任务,语音识别可分为4类:
5
应用
语音交互作为新的入口,主要应用于上图中的两大类:帮助人与人的交流和人与机器的交流。
帮助人与人的交流HHC:应用场景如,如翻译系统,
转载请注明:http://www.0431gb208.com/sjsbszl/1557.html