【文件属性】:
文件名称:who-is-the-asshole
文件大小:255KB
文件格式:ZIP
更新时间:2021-04-05 09:02:53
JupyterNotebook
谁是混蛋
一个NLP道德哲学家,他将阅读冲突的文字说明,并就作者是否是这种情况的混蛋做出道德判断。
数据源
数据来自subreddit 并已被此
根据subreddit本身,它是一个讲述您经历过的非暴力冲突的故事的地方; 讲故事的两面,找出你是对的还是你是个混蛋。
该项目中使用的功能是
帖子标题
柱体
裁决(YTA,NTA,ESH,NAH)
是混蛋
下面的参考图来自subreddit中的automod。 每个帖子评论都必须给出以下5个判断之一。 根据社群成员在评论中给出的判断,最终裁决以职位的天赋来表达。
如果故事中的另一方是混蛋,对于该项目而言并不重要,则将YTA和ESH转换为1,将NTA和NAH转换为0,表示OP(原始海报)是混蛋还是不是混蛋。
EDA
判决频率
在此数据集中的97,455个帖子中,大多数人都收到了NTA的裁决(不是混蛋)。
这是有道理的,因为人们倾向于发布
【文件预览】:
who-is-the-asshole-main
----who_the_a_2.ipynb(75KB)
----.gitignore(2KB)
----README.md(5KB)
----who_the_a.ipynb(129KB)
----who_the_a_min5.ipynb(68KB)
----image()
--------post_length.png(20KB)
--------verdict.png(28KB)
--------post_freq_hist.png(21KB)
--------sgd_sen_conf_matrix.png(10KB)
--------verdict_bar.png(14KB)
--------age_sex.png(26KB)
--------rfc_sen_conf_matrix.png(9KB)
----who_the_a_word2vec.ipynb(23KB)
----helpers.py(3KB)