使用selenium

时间:2023-03-09 13:36:04
使用selenium
1、安装谷歌浏览器
2、安装谷歌浏览器驱动
3、安装selenium包
4、测试
1、安装谷歌浏览器
2、安装谷歌浏览器驱动
检查自己的chrome浏览器版本,根据自己的浏览器版本选择对应的驱动版本,
下载之后解压之后,
Ubuntu中将驱动器文件拷贝到/usr/bin目录下
Windows中可以直接放在调用浏览器的*.py所在文件目录下
echo $PATH 查看环境变量
将驱动程序直接放到环境变量下
3、安装selenium包
用pycharm安装:
pip install selenium
安装后,
Windows中要设置webdriver.py路径的环境变量
D:\biancheng\work\crawler_py3_zzl\Lib\site-packages\selenium\webdriver\firefox
否则from selenium import webdriver找不到webdriver模块
4、测试
if __name__ == '__main__':
# 创建浏览器
driver = webdriver.Chrome()
# 请求url
url='https://www.baidu.com/s?wd=深圳';
driver.get(url)
# 保存快照
# driver.save_screenshot('baidu.png')
# 常用定位
el=driver.find_element_by_id('kw')
print(el.get_attribute('value'))

  

【selenium使用方法小结】:

# 小结:
# 1、调用环境变量指定的PhantomJS浏览器创建浏览器对象
driver = webdriver.Chrome(r'D:\xxx\chromedriver.exe') # 2、get方法请求页面,获取响应
url = "https://www.baidu.com/"
driver.get(url) # 3、打印标题
print(driver.title) # 4、打印登录页面的代码
html_str = driver.page_source
print(html_str)
# print(type(html_str))
# print(len(html_str)) # 5、根据xpath、id选择元素,并点击
baidu_click = driver.find_element_by_xpath("//div[@class='header_menu_item_body']/div[7]")
# baidu_click = driver.find_element_by_id("header_menu_item_body")
baidu_click.click() # 6、根据xpath、id选择元素,并填写内容
bd_searchbox = driver.find_element_by_xpath("//input[@class='input_username']")
bd_searchbox.send_keys(account) # 7、提取url
print(driver.find_element_by_xpath("//div[@class='title']/a/@href"))
# 8、提取文本
print(driver.find_element_by_xpath("//div[@class='title']/a/text"))