毕业论文
您现在的位置: 语言识别 >> 语言识别优势 >> 正文 >> 正文

Mozilla开放源码数据集实现多语言语

来源:语言识别 时间:2024/8/6
北京中科白癜风医学研究院 https://jbk.39.net/yiyuanzaixian/bjzkbdfyy/bdf/
Mozilla正在扩展它的众包通用语音项目,该项目旨在创建一个开源的语音识别数据集,以包含更多的语言。这个科技组织在去年6月首次宣布了“共同声音”,邀请来自世界各地的志愿者通过网络和移动应用程序录制文本片段。这个项目与亚马逊(Amazon)、谷歌、苹果(Apple)和微软(Microsoft)等公司正在开发的越来越多的专有语音识别技术形成了对比。上述巨头正大举投资于声控数字助理Alexa、谷歌Assistant、Siri和Cortana,但各自的数据集都属于这些公司自己。去年11月,Mozilla发布了第一个英语通用语音数据集的成果,该数据集包含了大约个小时的演讲,从2万人口中收集了40万段录音。今天,Mozilla正式开始为另外三种语言收集语音数据——法语、德语,还有一点随意的威尔士语。另外40种语言正在为数据收集过程做准备,巴西葡萄牙语、中国语(台湾)、印度尼西亚语、波兰语和荷兰语等已经准备好开始众包语音数据。多年来,语音将成为技术领域的下一个大型平台,这一点是显而易见的。就在昨天,亚马逊(Amazon)正式发布了新的内置摄像头、支持alexa功能的EchoLook智能扬声器,可以告诉你该穿什么。我们仍处在这一运动的早期,但很明显,声音只会变得更加普遍。正是在这种背景下,Mozilla正在推进创建一个开源数据集的计划,任何人都可以自由地使用该数据集,将语音识别智能构建到各种应用程序和服务中。Mozilla的首席创新官凯瑟琳娜·博切特(KatharinaBorchert)在一篇博客文章中说:“我们认为,这些界面不应该由少数公司作为语音服务的把关人来控制,我们希望用户能够始终以自己的语言和口音被理解。”通用语音项目的目的和其他开放许可项目的目的类似,这些项目都是针对私有平台的。OpenStreetMap是类似众包项目的一个很好的例子,该项目为开发人员提供开放的、可自由使用的世界地图,而不需要像谷歌maps这样的竞争服务的成本或限制。在可及性方面,在许多方面,英语可能是互联网的通用语,但事实仍然是,大多数人说的不是英语,而是母语。随着人工智能语音识别革命的深入发展,任何为开发人员和技术人员提供多语言数据集来训练机器学习模型的东西都只能是件好事。Mozilla共同语音项目的数字战略家MichaelHenretty补充说:“多语种语音标志着普通语音的一大步,我们希望它也是语音技术的一大步。”“让语音技术民主化不仅会降低全球创新的障碍,还会降低获取信息的障碍。”

转载请注明:http://www.0431gb208.com/sjszjzl/7177.html