最近有朋友想要采集优酷的视频标题和缩略图 (哈哈, 并非商业目的). 找到我帮忙, 考虑到有我刚刚发布的SpiderStudio, 我毫不犹豫的答应了.
首先在网页上视频的基本结构为:
div.v
- div.v-meta-title //标题
- div.v-thumb / img //缩略图
对应的JQuery表达式为:
$("div.v").find("div.v-meta-title");
$("div.v").find("div.v-thumb img");
然后运行SpiderStudio, 编写相关脚本:
public void Run()
{
Logger.ClearAll();
var vList = Default.SelectNodes("div.v");
foreach(var v in vList)
{
Logger.Log(v.SelectSingleNode("div.v-meta-title").Text());
Logger.Log(v.SelectSingleNode("div.v-thumb img").Attr("src"));
}
}
运行, 得到结果:
这里有我几篇文章介绍如何在C#脚本中运用JQuery, 供大家参考: