毕业论文
您现在的位置: 语言识别 >> 语言识别前景 >> 正文 >> 正文

专访哈工大刘挺教授自然语言处理迎来黄金时

来源:语言识别 时间:2024/10/20
机器之心原创作者:李泽南在11月7日举行的微软21世纪计算大会上,来自哈尔滨工业大学的刘挺教授向我们介绍了中文信息处理技术的前沿进展。演讲过后,机器之心对刘教授进行了专访,他与我们聊到了哈工大近期在AI上的研究,国内外NLP技术的发展,以及哈工大人工智能研究院的愿景。刘挺对于国内年轻学者的研究提出了建议,也对目前顶会论文「注水」的现象发表了看法。他还表示,明年哈工大很有可能就会开始招收人工智能专业的本科生了。刘挺教授是国内自然语言处理(NLP)领域的领军人物,任哈尔滨工业大学人工智能研究院副院长、计算机学院社会计算与信息检索研究中心主任。刘挺是国家「万人计划」科技创新领军人才,教育部人工智能科技创新专家组成员,主要研究方向为人工智能、自然语言处理和社会计算。其所带领的哈工大社会计算与信息检索研究中心(HIT-SCIR)是目前国内顶尖的NLP研究机构之一。刘挺教授以下采访内容进行了部分整理。有关哈工大SCIR机器之心:作为国内顶尖的AI实验室,哈工大社会计算与信息检索研究中心(HIT-SCIR)近期有哪些新研究?刘挺:我们最近进行了一些有趣的研究。首先是提出了事理图谱,常规知识图谱的每一个节点可以是名词(实体或概念),但在很多时候,我们需要去了解一些事件之间的关系,我们称之为事理。现在我们说的深度学习缺少可解释性,事理分析可以帮助我们解释推断的原因。这是我们最近研究的一个重点,也得到了大家的认可。但目前事理分析的方向还有存在很多挑战,我们欢迎更多的业界的同仁和我们一道继续讨论这个方向。第二个研究有关语义理解。哈工大的句法分析技术在年的CoNLL国际句法分析评测中,针对57种语言取得世界第一的成绩,超过了斯坦福、IBM等大学和公司。尽管如此,用同样的算法在中文和在英文上做句法分析,中文比英文差8个百分点左右。我觉得其中的一个核心原因就是中文天然缺少形态、时态的变化。我们提出的「语义依存分析」方法「一步跨越了两步半」,它很像句法分析:句子分析结果也是依存树,但是词间关系已经不是主谓宾状定补等语法关系,而是施事、受事、工具,时间、地点等语义关系。通过一步到位的方法,我们现在能够得到的结果,在语义分析阶段和英文就比较接近了。我很看好这项研究未来的发展,在它做完之后,语义依存树的表示是可以直接帮助回答问题了。在SCIR实验室中还有很多研究,覆盖了底层的句法、语义分析,应用层面的人机对话、情感分析、知识图谱等多方面的工作。机器之心:您曾经说过,哈工大SCIR的研究工作并不面向纯理论,同时也不完全面向应用,如何在这样的指导思想下寻求突破性研究?刘挺:哈工大是一所典型的工科大学,我们一直致力于理论与实践的结合。SCIR实验室致力于通过和工业界的合作去了解真实问题,同时结合领域内最先进的技术进展寻求新的突破。我们希望站在比企业再超前3到5年,甚至5到10年的位置上,通过原理的创新以及纯净的方法,把技术指标向前推进一步。通过和企业的合作,我们发现了很多真实场景下非常有趣的问题。

转载请注明:http://www.0431gb208.com/sjsbszl/7827.html