data-mining-project-2

时间:2024-04-20 01:14:14
【文件属性】:

文件名称:data-mining-project-2

文件大小:192.57MB

文件格式:ZIP

更新时间:2024-04-20 01:14:14

HTML

项目2:人在环 一种数据挖掘类型是协助人们处理大量数据。 所谓的“环环相扣”流程通常通过利用机器学习模型来工作,这些模型可帮助确定相关信息的优先级并消除不太可能的选择。 例如,一个逻辑回归可以识别候选服装客户,他们可能会喜欢给定他们的年龄,性别,位置和过去的选择,而设计师会做出最终选择(例如Stitchfix在内部进行类似的选择)。 该项目的目标是让您通过人在回路模型对文本数据执行数据挖掘。 特别是,要求您通过职务说明进行挖掘,以识别与给定简历相关的前3名职务说明。 激励性的例子是在不要求学生阅读每一个作业的情况下,帮助学生完成数千个作业说明。 您的目标应该是优化与简历的对齐方式,并拥有多种选择。 例如,如果您的前三项建议是来自3家不同技术公司的数据分析师,那么您可能已经实现了统一,但却没有实现多元化的目标。 数据可在CourseWorks上找到。 这是使用不同的职务从上刮下来的,但


【文件预览】:
data-mining-project-2-main
----tfidf_test.rmd(2KB)
----README.html(724KB)
----main_files()
--------figure-html()
----create_merged_csv.rmd(4KB)
----Resume_data()
--------resume1.txt(5KB)
--------resume1.pdf(231KB)
----Indeed_data()
--------indeed_job_descs_2021_03_18_california.json(3.5MB)
--------merged.csv(8.78MB)
--------cos_dissm_mat.csv.gz(49.63MB)
--------indeed_job_descs_2020_09_20.json(1.93MB)
--------indeed_job_descs_2021_01_25.json(567KB)
--------indeed_job_descs_2021_03_16.json(3.39MB)
----README.md(3KB)
----data-mining-project-2.Rproj(205B)
----main.html(798KB)
----main_cache()
--------html()
----.gitignore(46B)
----main.Rmd(9KB)

网友评论