这篇文章给大家介绍如何在Python中使用selenium,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。
selenium是一个web自动化测试工具,selenium可以直接运行在浏览器上,可以接收指令,让浏览器自动加载页面,获取需要的数据。
selenium的基本使用
1.导包
from selenium import webdriver
2.创建driver对象
webdriver.PhantomJS()
3.请求数据
driver.get("http://www.baidu.com")
4.查看网页源码
driver.page_source
5.关闭无界面浏览器
driver.quit()
6.根据id定位元素
drivrt.find_element_by_id("kw")
7.操作点击事件
click()
8.给输入框赋值
send_keys()
selenium的定位操作
定位元素语法:
find_element_by_id(返回一个元素)
find_elements_by_xpath(返回一个包含元素的列表)
find_elements_by_link_text(根据连接文本获取元素列表)
find_elements_by_partial_link_text(根据链接包含的文本获取元素列表)
find_elements_by_tag_name(根据标签名获取元素列表)
find_elements_bu_class_name(根据类名获取元素列表)
注意
find_element和find_elements的区别:多了个s返回列表,没有s的返回匹配到的第一个。
获取数据
获取文本:element.text
获取属性值:element.get_attribute("href")
selenium的其他方法
selenium处理cookie
driver.get_cookies()
,获取的是完整的cookie信息,不光有name、value,还有domain等其他信息。
# 把cookie转换为字典 cookies_dict = {cookie['name']: cookie['value'] for cookie in driver.get_cookies()} # 删除一条cookie driver.delete_cookie("CookieName") # 删除所有cookie driver.delete_all_cookies()
页面等待
time.sleep(10)
selenium执行js代码
driver.execute_script('js语句')
switch方法切换的操作
1.窗口切换
# 获取当前所有的窗口 current_windows = driver.window_handles # 根据窗口索引进行切换 driver.switch_to.window(current_windows[1])
2.selenium默认访问不了frame中的内容,对应解决的方法是driver.switch_to.frame()
3.处理页面弹窗提示
driver.switch_to.alert()
页面前进和后退
driver.forward() # 前进 driver.back(() # 后退
selenium的优缺点
优点:selenium能够执行页面上的js,对于js渲染的数据和模拟登陆处理起来较容易。
缺点:selenium由于在获取页面过程会发送很多请求,所以效率非常低。
关于如何在Python中使用selenium就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。