现在智能手机可以理解像"打电话给妈妈","给老板发信息","播放最新歌曲","打开交流"等指令,但是这是如何做到的呢?一个简单的答案是语音识别。
语音识别于年由IBM首次推出,当时它推出了第一台能够将人类语音转换为文本的机器。今天,在人工智能(AI)、机器学习(ML)和深度学习等最新技术的推动下,语音识别正在触及新的里程碑。
全球顶级公司正在利用这一最新技术进步,使其用户体验高效、流畅。亚马逊的Alexa、苹果的Siri、谷歌助手、Facebook的OculusVR和微软的Cortana等技术都是语音识别的例子。
语音识别在人工智能和机器学习出现之前是一个非常利基(niche)的领域,现在已经完全改变了。在我们了解人工智能和机器学习是如何做出更改之前,先看一下这些术语的细微差别。
人工智能
人工智能是机器能够像人类或动物一样展示智力的技术。最初,人工智能只是记住数据并相应地生成结果;然而,现在它远不止于机器执行各种活动,如语音识别、对象识别、翻译文本等等。
人工智能的另一个最新成员是深度学习。在深度学习的帮助下,机器可以处理数据并创建模式,帮助他们做出有价值的决策。机器通过深度学习的这种行为类似于人脑的行为。深度学习活动可以"监督"、"半监督"和"无人监督"。
机器学习
机器学习是人工智能的一个子部分,它教机器记住过去的事件和活动。通过机器学习,机器经过培训,可以保留各种数据集的信息和输出,并识别这些决策中的模式。它允许机器在没有编程代码帮助的情况下自行学习。
机器学习的一个例子是电子商务网站向您推荐产品。该代码一旦编写,允许机器自行演变并分析用户行为,从而根据产品偏好和过去的购买情况推荐产品。这涉及到零人干扰,并利用人工神经网络(ANN)等方法。
语音识别
语音识别只是理解用户语音并将其转换为文本的活动。它主要有3种类型:
自动语音识别(ASR)
计算机语音识别(CSR)
文本语音(STT)
注意:音频识别和语音识别(声纹识别)是两码事。前者理解语音样本并将其转换为文本样本,而后者的唯一目的是识别语音并识别其所属人。语音识别通常用于安全和真实性目的。人工智能和机器学习如何影响语音识别的未来?由于人工智能和机器学习技术的发展,我们设备中语音识别的使用量有了很大的增长。语音识别现在正被用于从唤醒你的电器和小工具到监控你的健康,播放情绪增强的歌曲,在搜索引擎上运行查询,甚至打电话等各种任务。全球语音识别市场目前以17.2%的累计年增长率增长,预计到年将突破亿美元大关。然而,最初使用人工智能和机器学习已经解决了巨大的挑战。在初始阶段,语音识别的一些最大挑战是语音录制设备不良、语音样本中的巨大噪声、同一用户语音中的不同音高等。除此之外,不断变化的方言和语法因素,如同义词也是一个很大的挑战。在能够过滤声音、消除噪声和根据上下文识别单词含义的人工智能程序的帮助下,这些挑战大部分都得到了解决。如今,语音识别的效率达到了95%,而在30年前,这一数字还不到20%。程序员目前面临的最大挑战是制造能够理解情绪和感情的机器,并在这方面取得令人满意的进展。语音识别效率的提高正在成为其成功的重要驱动因素,顶尖科技巨头正在利用这些优势。仅在年,超过20%的用户通过语音在Google上搜索,预计这个数字现在将更加突出。下面列出了当今语音识别的一些关键用法。语音识别的最常用性是执行基本活动,如在Google上搜索、设置提醒、安排会议、播放歌曲、控制同步设备等。语音识别现在也被用于各种金融交易,一些银行和金融公司向用户提供"语音传输"功能。在语音识别的帮助下,从一种语言翻译到另一种语言也变得容易多了。语音识别的一个关键用途是发现新歌曲。有许多网站,可以告诉你这首歌的名字,只是听你哼着它的音乐。这项技术还有助于转录视频讲座,然后这些讲座的副本通常附有视频文件。您可以使用语音识别,来进行GPS导航和旅游规划。信息源于:signalscv
关于我们
21dB声学人是中国科学院声学研究所苏州电声产业化基地旗下科技媒体,专注于声学新技术、音频测试与分析、声学市场调研、声学学习社群建设等。合作推广
稿件投稿|项目推广|创业支持请发送需求至以下邮箱,我们将派专人与您联系21dbioasonic.转载请注明:http://www.0431gb208.com/sjszlfa/109.html