微软在其翻译服务Translator中,又加入12种新语言和方言,包括巴什基尔语、迪维希语、藏语、土库曼斯坦语、维吾尔语和乌兹别克斯坦语等,当前全球总共有8,万人使用这些语言。微软提到,在加入12种语言之后,Translator已经可以支持种语言,语言覆盖人数达到56.6亿人。
由于主流语言资源多,因此翻译服务要提供像是英语、华语、印地语、阿拉伯语和西班牙语,相对简单许多,而近年来由于技术的进步,人工智能技术也逐渐可以对资源匮乏或是濒临灭绝的语言,提供翻译服务。
微软的机器翻译服务,使用一种称为Z-code的多语言人工智能模型,该模型能够结合同一家族语言,像是印地语、马拉地语和古吉拉特语等印度语,通过让各个语言模型相互学习,降低达到高品质翻译所需要的资料量。微软举例,当翻译模型使用相关的法语、葡萄牙语、西班牙语和意大利语资料一起训练,罗马尼亚语的翻译品质会得到提升。
微软提到,借由公用性和迁移学习,能同时改进整个语言家族的翻译品质,而且减少资料需求,对资源有限或是母语人口减少,而濒临灭绝的语言,得以创建语言模型。
转载请注明:http://www.0431gb208.com/sjsbszl/3827.html