毕业论文
您现在的位置: 语言识别 >> 语言识别前景 >> 正文 >> 正文

扩展命名实体识别API及其在语言教育中的

来源:语言识别 时间:2022/10/12

ACLSystemDemonstrations

扩展命名实体识别API及其在语言教育中的应用

ExtendedNamedEntityRecognitionAPIandItsApplicationsinLanguageEducation

Alt公司

AltInc

我们提出了一个扩展命名实体识别API来识别各种类型的实体,并将实体分类为个不同的类别。每个实体都被划分为实体类别中的一个层次,其中层次结构中根附近的类别比叶子附近的类别更具有概括性。这些类别信息可用于各种应用程序,如语言教育应用程序、在线新闻服务和推荐引擎。本文展示了该API在一个针对日语学习者的日文在线新闻服务中的应用。

1引言

命名实体识别(NER)是信息检索、信息提取和问答系统(Bellotetal.,2;NadeauandSekine,7)中最基本的任务。因此,一个高质量的命名实体识别API(应用程序编程接口)对于更高层次的任务,如实体检索、推荐和自动对话生成非常重要。为提高命名实体的识别能力,Sekin等人(Sekineetal.,2;SekineandNobata,4)提出了一种扩展的命名实体(ENE)的层次结构,改善了命名实体的定义。ENE的层次结构是一个三层结构,顶层包含十个以上的粗粒度类别,叶级包含个细粒度类别。

层次结构的顶层包括传统的命名实体类别,如人、地点或组织。中间层和叶级将顶级分类细化到更细粒度的类别。图1显示了顶级类别“组织”的部分层次结构。在扩展的命名实体识别(ENER)问题,给定一个输入的句子,如“DonaldTrumpwasofficiallynominatedbytheRepublicanParty”,系统必须识别并对句子中的扩展命名实体进行分类,如“DonaldTrump”为“人”的类别,“RepublicanParty”为“政党”类别。

图1扩展命名实体(ENE)的层次结构

本文提出一个日文扩展命名实体识别API的体系结构设计与实现。我们称这个API为“AL+ENERAPI”。在大量训练数据样本下,所提出的架构表现出良好效能,并在实际应用中具备较快的响应速度。为说明AL+ENERAPI的有效性,我们描述了此API在日语在线新闻服务中术语自动提取的应用。从用户的反馈表明,ENERAPI在词汇产生任务中表现出较高的准确率。

本文的如下部分安排如下。第2节描述了ENERAPI的技术的设计与实现。第3节给出了实验结果以评估API的性能。第4节描述了ENERAPI在为日语学习者设计的在线新闻服务中的应用,从服务中获取用户反馈以提高ENER系统性能的方法,以及从用户反馈得到的统计数据。第5部分回顾了相关系统并与该系统进行对比。最后,第6节总结全文。

2扩展命名实体识别API

2.1AL+ENERAPI概述

AL+ENERAPI是一款扩展命名实体识别的应用程序编程接口,它以一个句子作为输入,输出为一个包含句中扩展命名实体的JSON列表,如图2所示。

图2AL+ENE识别API

不同于传统的命名实体识别API,这个API可以标注能源大类(类别列表见:

转载请注明:http://www.0431gb208.com/sjsbszl/1941.html