当微软和Google为谁的人工智能聊天机器人更好而使出浑身解数时,我们不难发现这并不是机器学习和语言模型的唯一用途。除了传闻中计划在今年的年度GoogleI/O活动中展示20多种由人工智能驱动的产品外,Google正在朝着建立一个支持种不同语言的人工智能语言模型的目标迈进。
在周一发布的更新中,Google分享了有关通用语音模型(USM)的更多信息,Google称这一系统是实现其目标的"关键第一步"。
去年11月,该公司宣布其计划创建一个支持全球种最常用语言的语言模型,同时还披露了其USM模型。Google将USM描述为"一个最先进的语音模型系列",它有20亿个参数,在万小时的语音和超过种语言的亿个句子中进行训练。
YouTube已经使用USM来生成封闭式字幕,它还支持自动语音识别(ASR),这可以自动检测和翻译语言,包括英语、中文普通话、阿姆哈拉语、宿务语、阿萨姆语等等。
现在,GoogleUSM支持超过种语言,并将作为"基础"来建立一个更加广泛的系统。与此同时,Meta公司正在开发一个类似的人工智能翻译工具,但目前仍处于早期阶段。
您可以在Google发布的研究论文中阅读更多关于USM和它如何工作的信息:
转载请注明:http://www.0431gb208.com/sjsbszl/8160.html