简单的说,就是解析html文档的,以前发送一个get请求获取一个页面的html文本后,想要获取里面的数据都是使用正则表达式.(非常的苦逼),
现在用这个获取就very easy! 安装的话在Nu Get上搜索Jumony.Core 下载即可.
具体介绍:http://www.cnblogs.com/Ivony/p/3447536.html
来个简单的Demo,获取博客园C#分类的所有文章标题
著作权归作者所有。
商业转载请联系作者获得授权,非商业转载请注明出处。
作者:卷猫
链接:http://anneke.cn/ArticleInfo/Detial/20
来源:Anneke.cn namespace JumonyCoreDemo
{
class Program
{
static void Main(string[] args)
{
//从指定的地址加载html文档
IHtmlDocument source = new JumonyParser().LoadDocument("http://www.cnblogs.com/cate/csharp");
var aLinks = source.Find(".titlelnk");//按照css选择器搜索符合要求的元素
foreach (var aLink in aLinks)
{
//<a>Hello</a> 获取hello
Console.WriteLine(aLink.InnerText());
//获取 a标签和它的父节点 <h3><a>Hello</a></h3>
Console.WriteLine(aLink.Parent());
//<a>Hello</a> 获取hello
Console.WriteLine(aLink.InnerHtml());
//获取指定属性名的值 value和AttributeValue都可以获取,但区别是value当 当前属性对象为null时不会抛出异常
Console.WriteLine(aLink.Attribute("href").Value());
Console.WriteLine(aLink.Attribute("href").AttributeValue);
}
Console.ReadKey();
}
}
}
熟悉html css的非常容易上手,不得不说真的好用
Demo下载:https://github.com/zhenzhenkeai/JumonyCoreDemo