语音识别大家一定不会陌生,随着人类社会进入智能化,与机器交流已然成为必然趋势,所以语音识别技术可以说是“百家争鸣”。年,微软研究院的一个团队宣布,他们的机器学习算法经过训练后,将语音资料库的录音转换成文本的准确率可以高达94%,但最后6%的准确率却无法达到。 对于语音识别准确率在我们使用智能语音转换文字的过程中就可以明显的感觉到,偶尔会出现有与我们所说不符的情况。不过,我们显然已经取得了重大的进展。很多语音智能公司,也已经开始提供在线服务。用户可以上传数字音频文件,在几分钟后就能获得语音转录的文本。服务软件生成文本的速度在提升,而所需的费用也在不断降低,这确实令人欣喜,但准确率却依然没有达到百分之百。其实在小编看来,就我们人类自身在语音对话中都不可能做到百分之百的准确率,当我们和朋友交谈时,也总是会有一两句话听不清楚,会说一句“抱歉,能否重复一次,刚刚没有听清楚。对于语音识别软件而言,校对一份准确率为94%的文本耗费的时间,几乎和直接手动转录原始录音所耗费的时间相差无几。但是遗憾的是这么多年仍然没有软件可以将语音识别的准确率提高至95%以上,仅仅是能处理音质清晰、没有口音的语音。语音识别软件可能永远无法达到%的准确率。毕竟人们说话未必总是十分流利,即使是使用母语。语言中也有太多需要结合上下文才能理解的同音异义词。人类所期望的是,这些语音服务还能提升1%~2%的准确率。不至于每次用语音转换工具或者是对着智能工具喊话时因为准确率的问题而重复多次,这样不仅极大的考验了我们的耐心,也大大降低了效率。不过随着科学技术的发展,随着机器语音和计算机对模糊语音的识别准确性的提升,可靠的语音转录技术将不再是奢侈的幻想或是遥遥无期的目标,它必然会实现。
转载请注明:http://www.0431gb208.com/sjszlfa/7819.html