python爬虫必备库BeautifulSoup4学习笔记

时间:2021-06-13 15:21:16
【文件属性】:
文件名称:python爬虫必备库BeautifulSoup4学习笔记
文件大小:50KB
文件格式:HTML
更新时间:2021-06-13 15:21:16
python BeautifulSou BS4 学习笔记 官方文档 完整介绍了python爬虫必备库BeautifulSoup4库里的几乎所有内容: Table Of Contents - Beautiful Soup 4.2.0 文档 - 对象的种类 - Tag 标签 - Name Tag的名字 - Attributes 操作类似于字典 比如id,class_ - 多值属性 - 可以遍历的字符串 1.字符串常被包含在tag内.Beautiful Soup用 NavigableString 类来包装tag中的字符串 2.一个 NavigableString 字符串与Python中的Unicode字符串相同,通过unicode() 方法可以直接将 NavigableString对象转换成Unicode字符串 3.tag中包含的字符串不能编辑,但是可以被替换成其它的字符串,用 replace_with() 方法 - BeautifulSoup - 注释及特殊字符串 - 遍历文档树 - 子节点 ……………………………………

网友评论