Google离建立其1000种语言的人工

来源：语言识别时间：2024/12/24

当微软和Google为谁的人工智能聊天机器人更好而使出浑身解数时，我们不难发现这并不是机器学习和语言模型的唯一用途。除了传闻中计划在今年的年度GoogleI/O活动中展示20多种由人工智能驱动的产品外，Google正在朝着建立一个支持种不同语言的人工智能语言模型的目标迈进。

在周一发布的更新中，Google分享了有关通用语音模型（USM）的更多信息，Google称这一系统是实现其目标的"关键第一步"。

去年11月，该公司宣布其计划创建一个支持全球种最常用语言的语言模型，同时还披露了其USM模型。Google将USM描述为"一个最先进的语音模型系列"，它有20亿个参数，在万小时的语音和超过种语言的亿个句子中进行训练。

YouTube已经使用USM来生成封闭式字幕，它还支持自动语音识别（ASR），这可以自动检测和翻译语言，包括英语、中文普通话、阿姆哈拉语、宿务语、阿萨姆语等等。

现在，GoogleUSM支持超过种语言，并将作为"基础"来建立一个更加广泛的系统。与此同时，Meta公司正在开发一个类似的人工智能翻译工具，但目前仍处于早期阶段。

您可以在Google发布的研究论文中阅读更多关于USM和它如何工作的信息：