教育部哲学社会科学实验室
北京外国语大学人工智能与人类语言实验室
系列学术讲座
古代语言文献摘要技术及隐喻计算研究
年4月27日(周三)15:00-16:30
本讲座将主要介绍主讲人在古代语言文献摘要及隐喻计算两方面的工作。(1)自动摘要是自然语言处理领域的一个经典任务,其核心目标是从输入中提炼出关键信息,继而转化为一段简短概述。与传统自动摘要相比,我们以古代语言文献为输入,以基于输入相应的现代语言文本摘要为输出,来实现古代文献摘要这一新任务。历史和数字人文研究人员一向重视古代文献摘要工作,但迄今为止一直未实现其自动化处理。基于跨语言迁移学习技术,我们提出了不依赖跨语言平行训练语料(古代到现代)的古代文献摘要模型。同时,基于古德语和古汉语新闻语料我们还构造了一个高质量摘要测试集,并经自动和人工评测有效证明我们的迁移学习摘要模型在这项任务上的表现优于标准跨语言摘要模型。(2)隐喻是人类语言中非常普遍的语言现象,隐喻识别对于自然语言处理各项任务来说具基础性的重要意义。针对英文领域的隐喻识别任务,我们提出了结合词向量和WordNet的非监督方法来识别隐喻单词,以及基于深度学习的端到端隐喻识别模型。
转载请注明:http://www.0431gb208.com/sjslczl/508.html