毕业论文
您现在的位置: 语言识别 >> 语言识别资源 >> 正文 >> 正文

NLP算法入门系列智能客服中的日期识别

来源:语言识别 时间:2024/1/20
白癜风控制 http://m.39.net/disease/a_9575263.html
文/IT可达鸭图/IT可达鸭、网络

01前言

最近在做一个智能客服聊天系统,刚好涉及到了一些“意图识别”、“命名实体识别”的算法。在这里简单介绍一下实现思路,以及源码分享。

02NER详解

命名实体识别(NamedEntityRecognition,简称NER)是信息提取、问答系统、句法分析、机器翻译等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比)命名实体。本文主要介绍时间类(时间、日期)的识别和提取,基于jieba的分词以及词性标注,采用规则算法识别。

03使用NER的场景

在工程项目中,日期时间识别的任务经常会遇到。这里分两种情况:1.结构化数据,例如:XML、JSON文档,日期往往会有良好的规范,很容易可以解析并还原到对应的日期时间;2.非结构化数据,像txt、doc文本,日期和文本混杂在一起,此时日期的识别和提取就变得困难很多。这里主要针对非结构化的数据,进行日期和时间的识别和提取。这里假设一个应用背景,设计一款智能客服,主要帮住客进行预定机票、入住酒店以及售后。要根据用户会话,识别出用户的需求(这里只识别时间和日期)。

04理想中的输出

由于用户使用的自然语言并不是严格的数字,会给出诸如:“明天早上八点”、“昨天凌晨”、“八月十五号”等形式。本文不

转载请注明:http://www.0431gb208.com/sjslczl/6914.html

  • 上一篇文章:
  • 下一篇文章: 没有了