【文件属性】:
文件名称:jsoup:jsoup:Java HTML解析器,构建用于HTML编辑,清理,抓取和XSS安全
文件大小:538KB
文件格式:ZIP
更新时间:2021-02-03 16:50:34
css java html parse dom
jsoup:Java HTML解析器
jsoup是一个用于处理实际HTML的Java库。 它使用HTML5最佳DOM方法和CSS选择器,为获取URL以及提取和处理数据提供了非常方便的API。
jsoup实现规范,并将HTML解析为与现代浏览器相同的DOM。
从URL,文件或字符串中抓取并HTML
使用DOM遍历或CSS选择器查找和
处理,属性和文本
根据安全列表用户提交的内容,以防止XSS攻击
输出整洁HTML
jsoup旨在处理野外发现的所有各种HTML; 从原始和验证到无效的标签汤; jsoup将创建一个明智的解析树。
有关下载和完整的请参见 。
例
获取主页,将其解析为 ,然后从“新闻中”部分的标题中选择列表:
Document doc = Jsoup . connect( " https://en.wikipedia.org/ " ) . get();
log(doc . title());
Elements newsHeadlines = doc . select( " #mp-itn b a " );
for ( Element headline : newsH