【文件属性】:
文件名称:LinkedinScraper-1:抓取linkedin候选人并将其添加到excel表中
文件大小:28.62MB
文件格式:ZIP
更新时间:2021-06-01 17:12:41
Java
链接爬虫
作者:韦斯顿杰克逊
westonjackson2106@gmail.com
LinkedinScraper 允许用户输入候选关键词并接收一份包含候选人、LinkedIn 个人资料和当前职位的 Excel 表格。 它通过谷歌搜索绕过 Linkedin 安全措施,并通过在 1-15 秒之间的随机间隔发出请求来绕过谷歌安全措施。 使用 GUI 时,用户还可以指定 Google 的页数来搜索候选人。
所需的外部库:
htmlunit-2.16
Selenium-2.45.0
课程:
ScraperGUI.java - Linkedin 抓取器的 UI,包含主要方法。 具有动作侦听器提交按钮的子类。
Scraper.java - 包含大部分程序,通过谷歌搜索结果解析以获得候选人的linkedin 个人资料。
Candidate.java - Candidate 对象包含名称、u