文件名称:NE2vec:用德语word2vec模型识别人物的小测试
文件大小:145KB
文件格式:ZIP
更新时间:2024-07-08 19:10:52
Python
命名实体和词表示 这段代码是为一项实验而创建的,目的是尝试识别可以通过人与词表示中一类命名实体的接近程度来指代人的德语名词。 这是一个如何重现这个实验的小教程。 您可以在上传的 pdf 文件中找到理论见解。 我假设对 Python 和命令行有基本的了解。 这个实验是在 Ubuntu 14.04 上完成的,我不知道它在其他操作系统上的重现性如何。 您确实需要至少 2GB 的 RAM 才能运行此实验,尽管使用更多 RAM 会方便得多。 所需软件 您必须安装一些软件,除非您已经拥有它。 克隆这个存储库 由于您使用的是 github,我假设您已经安装了 git。 打开终端并转到要安装存储库的文件夹。 git clone this_sites_url 斯坦福的命名实体识别 这是弱点。 斯坦福大学的 NER 占用大量内存(大约是输入文件大小的 1000 倍)。 从以下站点下载命名实体识别器以及下面
【文件预览】:
NE2vec-master
----NE2vec_theory.pdf(151KB)
----similarities.py(2KB)
----gutenberg.py(5KB)
----NER-to-w2v.py(3KB)
----test_set(327B)
----README.md(8KB)
----ner-ger.sh(215B)