毕业论文
您现在的位置: 语言识别 >> 语言识别资源 >> 正文 >> 正文

NLP入门实战必读一文教会你最常见的1

来源:语言识别 时间:2022/12/27
白癜风是什么原因引起的 http://baidianfeng.39.net/a_zczz/140526/4394583.html

大数据文摘作品

编译:糖竹子、吴双、钱天培

自然语言处理(NLP)是一种艺术与科学的结合,旨在从文本数据中提取信息。在它的帮助下,我们从文本中提炼出适用于计算机算法的信息。从自动翻译、文本分类到情绪分析,自然语言处理成为所有数据科学家的必备技能之一。

在这篇文章中,你将学习到最常见的10个NLP任务,以及相关资源和代码。

为什么要写这篇文章?

对于处理NLP问题,我也研究了一段时日。这期间我需要翻阅大量资料,通过研究报告,博客和同类NLP问题的赛事内容学习该领域的最新发展成果,并应对NLP处理时遇到的各类状况。

因此,我决定将这些资源集中起来,打造一个对NLP常见任务提供最新相关资源的一站式解决方案。下方是文章中提到的任务列表及相关资源。那就一起开始吧。

目录:

1.词干提取2.词形还原3.词向量化4.词性标注5.命名实体消岐6.命名实体识别7.情感分析8.文本语义相似分析9.语种辨识10.文本总结

1.词干提取

什么是词干提取?词干提取是将词语去除变化或衍生形式,转换为词干或原型形式的过程。词干提取的目标是将相关词语还原为同样的词干,哪怕词干并非词典的词目。例如,英文中:

1.beautiful和beautifully的词干同为beauti2.Good,better和best的词干分别为good,better和best。

相关论文:MartinPorter的波特词干算法原文

相关算法:在Python上可以使用Porter2词干算法(

转载请注明:http://www.0431gb208.com/sjslczl/2777.html