【文件属性】:
文件名称:word分词器java源码-A-Smattering-of-NLP-in-Python:Python中自然语言处理编程的非常简要介绍
文件大小:287KB
文件格式:ZIP
更新时间:2021-06-05 22:15:54
系统开源
word分词器java源码嘿,你!
是的,就是你。
不要尝试使用本
README
中的代码示例。
相反,下载此存储库中提供的
.ipynb
文件,启动
,然后在那里运行代码。
相信我们,你会更喜欢它。
您还可以在此处查看笔记本的不可运行版本(具有正确的语法突出显示和嵌入图像):
Python
中的
NLP
初识
通过查理格林贝克
一部分
-
2014
年
7
月
9
日
介绍
回到数据科学的黑暗时代,在自然语言处理
(NLP)
中工作的每个小组或个人通常都维护着各种各样的自制实用程序,旨在处理与
NLP
相关的许多常见任务。
尽管每个人都怀有最好的意图,但这些代码的大部分内容都是糟糕的、脆弱的并且文档不足——这不是构建您的杰作的良好基础。
幸运的是,在过去十年中,出现了诸如
的主流开源软件库,以提供一系列高质量的可重用
NLP
功能。
这些库使研究人员和开发人员可以将更多时间花在手头任务的应用逻辑上,而不是调试废弃的句子分割方法或重新实现名词短语组块。
本演讲将涵盖
NLTK(以及一些其他库)提供的一些
NLP
构建块,包括从
HTML
中提取文本、词干提取和词形还原、频率分析和命名实
【文件预览】:
A-Smattering-of-NLP-in-Python-master
----README.md(26KB)
----LICENSE(11KB)
----A Smattering of NLP in Python.ipynb(31KB)
----images()
--------i-was-told-there-would-be-no-math.jpg(50KB)
--------python-powered-w-200x80.png(9KB)
--------dcnlp.jpeg(19KB)
--------Scikit-learn_logo.png(23KB)
--------anaconda_logo_web.png(4KB)
--------no_time.jpg(116KB)
--------cat.gif(19KB)
--------stanford-nlp.jpg(23KB)