toxic_spans:检测有毒文本中的有毒跨度

时间:2021-05-09 23:30:41
【文件属性】:
文件名称:toxic_spans:检测有毒文本中的有毒跨度
文件大小:1.04MB
文件格式:ZIP
更新时间:2021-05-09 23:30:41
JupyterNotebook 有毒跨度检测(SemEval 2021任务5) 有毒跨度检测任务涉及在可能的情况下,对检测使文本有毒的跨度的系统进行评估。 审核对于促进健康的在线讨论至关重要。 尽管已经建立了多个毒性(又名侮辱性语言)检测数据集(Wulczyn等人,2017; Borkan等人,2019)和模型(Schmidt和Wiegand,2017; Pavlopoulos等人,2017b; Zampieri等人,2019)发布时,其中大多数将整个注释或文档分类,并且不标识使文本有毒的跨度。 但是,突出显示这种有毒跨度可以帮助人类主持人(例如,新闻门户主持人)经常处理冗长的评论,并且他们更喜欢归因,而不是每个帖子仅由系统生成的无法解释的毒性评分。 因此,对可以在文本中准确定位有毒跨度的系统进行评估是成功实现半自动审核的关键一步。 或直接了解有关此任务的更多信息。 在此存储库中,您将找到一个带有代码的笔记本,以准
【文件预览】:
toxic_spans-master
----.gitignore(2KB)
----evaluation()
--------fix_spans.py(1KB)
--------__init__.py(0B)
--------semeval2021.py(4KB)
--------fix_spans_test.py(2KB)
--------metrics.py(1KB)
--------semeval2021_test.py(1KB)
----appen-templates()
--------toxic_spans.css(765B)
--------toxic_spans.js(6KB)
--------toxic_spans.cml(1KB)
--------README(79B)
----data()
--------tsd_trial.csv(181KB)
--------tsd_test.csv(435KB)
--------__init__.py(0B)
--------tsd_train.csv(2.18MB)
----LICENSE(7KB)
----ToxicSpans_SemEval21.ipynb(29KB)
----README.md(1KB)
----baselines()
--------__init__.py(0B)
--------models.py(13KB)
--------spacy_tagging.py(3KB)

网友评论