19.XPath选择器

时间:2023-03-10 02:06:28
19.XPath选择器

1.extract():提取数据

2./text()     :获取节点内容文本

3./@href   :获取节点href属性

4. @         :获取属性名称

需要注意问题:

用定义的规则那所有符合要求的节点获取下来,返回的类型是列表类型。

但是如果节点只有一个就会出现错误:

大多数情况下,想要的是第一个元素的内容,通过索引获取,但是如果得到的是一个空列表就会造成数组越界。

提取单个元素: 用 .extract_first() 就不会出现数组越界的问题。