java使用Jsoup解析html字符串

时间:2022-10-31 08:09:14

jar包下载路径:点击打开链接

简单示例:

String s="html字符串"

 Document doc = Jsoup.parse(s);                                                   //html为内容    
 Element e_title = doc.getElementsByTag("标签名").get(0);               //根据标签名找title元素

 String title = e_title.text();                                                              //获取标签的文字





getElementById(String id)                          用id获得元素
getElementsByTag(String tag)                     用标签获得元素
getElementsByClass(String className)      用class获得元素
getElementsByAttribute(String key)             用属性获得元素


用下面的方法提供获取兄弟节点:
 siblingElements() 
 firstElementSibling()
 lastElementSibling()
 nextElementSibling() 
 previousElementSibling()
 
用下面方法获得元素的数据:
attr(String key)                        获得元素的数据
attr(String key, String value)          设置元素数据
attributes()                            获得所以属性
id()                                    获得id
className() classNames()                获得class得值
text()                                  获得文本值
text(String value)                      设置文本值
html()                                  获取html 
html(String value)                      设置html
outerHtml()                             获得内部html
data()                                  获得数据内容
tag()                                   获得tag 
tagName()                               获得tagname