selenium-获取一组数组进行操作（七）

selenium-获取一组数组进行操作

　　以纵横中文网中获取24小时畅销榜的书单为例

　　此文仅做 selenium 在自动化测试中怎么获取一组数据进行说明，不做网络爬虫解释

　　当然，使用爬虫得到本文的结果会简单快捷的多

区别 selenium 中的 elements 与 element

　　例如：list.find_elements_by_class_name('rank_i_bname') # 获得 class name 为 rank_i_bname 的所有数据

　　　　　list.find_element_by_class_name('rank_i_p_tit') # # 获得 class name 为 rank_i_p_tit 的一个数据，如果有多个则只取第一个

步骤：

　　使用 selenium 定位到总分类

　　然后通过判断24小时畅销榜，进入到24小时畅销榜的书目录

　　最后获得书名和作者

如下图

selenium-获取一组数组进行操作（七）

代码如下：

 #coding=utf-8

 from selenium import webdriver

 import unittest

 class getListall(unittest.TestCase):

     def setUp(self):

         # 纵横小说中文网

         base_url = 'http://book.zongheng.com/rank.html'

         self.driver = webdriver.Chrome()

         self.driver.implicitly_wait(10)

         self.driver.get(base_url)

     def test_get_list_all(self):

         u"""获取数组"""

         driver = self.driver

         # 获取所有分类

         lists = driver.find_elements_by_class_name('rank_i_p_list')

         for list in lists:

             # 获取24小时畅销榜下的书

             if list.find_element_by_class_name('rank_i_p_tit').text == "24小时畅销榜":

                 # 获取书

                 names = list.find_elements_by_class_name('rank_i_bname')

                 authors = list.find_elements_by_class_name('rank_i_bcount')

                 # 打印获取的数据

                 for name,author in zip(names,authors):

                    print(name.text + "，" + author.text + "；")

     def tearDown(self):

         self.driver.quit()

 if __name__ == '__main__':

     unittest.main()

运行结果

selenium-获取一组数组进行操作（七）

结果分析

　　分析结果会发现，第一个书单所获取的信息和其他的书单信息不一致

　　原因：查看网页html便可知

　　class=“rank_i_bname” 下的 text ，第一个书单和其他书单的信息是不一样的

　　　　 selenium-获取一组数组进行操作（七）

如果看起来不美观可以将第一个书单提取处理单独进行定位获取信息进行打印

　　　　然后在 for 循环中将获取到的书单的第一个信息不要打印

　　　　问题解决

秒客网

selenium-获取一组数组进行操作（七）

相关文章