NWEBCRAWLER(C#网络链接爬虫)

时间:2014-12-21 04:04:18
【文件属性】:

文件名称:NWEBCRAWLER(C#网络链接爬虫)

文件大小:664KB

文件格式:MSI

更新时间:2014-12-21 04:04:18

web链接

这是一个C#下的开源网络爬虫,你可以更改Fetch函数,以实现自己的应用。 按照你的需求,Fetch函数应该做以下工作: 1、检测抽取出的URL是否是本站的URL,如果是,继续爬行,如果不是,直接丢弃; 2、检测URL是否能正常访问(用HttpWebRequest),如果不能,那么是死链。


网友评论

  • 用是可以用,不过那个选择下载文件的路径貌似没有用。