Python中Selenium如何使用

发布时间：2021-08-05 17:36:17 来源：亿速云阅读：183 作者：Leah 栏目：大数据

本篇文章给大家分享的是有关Python中Selenium如何使用，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。

Selenium介绍

Selenium是一个Web的自动化测试工具，最初是为网站自动化测试而开发的，Selenium 可以直接运行在浏览器上，它支持所有主流的浏览器（包括PhantomJS这些无界面的浏览器（2018年开发者说暂停开发，chromedriver也可以实现同样的功能）），可以接收指令，让浏览器自动加载页面，获取需要的数据，甚至页面截屏。

安装

pip install selenium

二、Chromedriver的介绍

Chromedriver 也是一个能够被selenium驱动的浏览器，但是和PhantomJS（网上有很多这个的介绍）的区别在于它是有界面的。Chromedriver下载你需要先查看自己的Chrome浏览器的版本，然后选择对应的Chromedriver。

Python中Selenium如何使用

下载地址：https://npm.taobao.org/mirrors/chromedriver

----- Windows 下安装方式
chromedriver_win32.zip : 版本 ChromeDriver v2.32 (2017-08-30)
（支持 Chrome v59-61）

1. 解压 chromedriver_win32.zip
2. 将 chromedriver.exe 移动到 Python安装目录下
（其实放哪都可以，但是需要配环境变量，放Python安装目录下省事）


注意：Chromedriver和电脑上的chrome版本有对应关系，建议使用最新的Chromedriver版本并且更新chrome浏览器到最新版

三、Selenium的基本使用

是否开启无头模式（即是否需要界面）

from selenium.webdriver import Chrome
from selenium.webdriver.chrome.options import Options

option = Options()  # 实例化option对象
option.add_argument("--headless")  # 给option对象添加无头参数

driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe",  # 实例化浏览器对象,可以指定chromedriver的路径,不指定的话 默认会去找python解释器的同级目录
                options=option)  # 实例化浏览器对象的时候 把option对象带进来

保存当前网页的截图

from selenium.webdriver import Chrome

driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe",  # 实例化浏览器对象,可以指定chromedriver的路径,不指定的话 默认会去找python解释器的同级目录
                # options=option)  # 实例化浏览器对象的时候 把option对象带进来
                )
driver.get("https://www.baidu.com/")
driver.save_screenshot('baidu.png')  # 保存当前网页的截图
driver.close()  # 关闭当前网页

浏览器窗口最大化

from selenium.webdriver import Chrome

driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe")
driver.maximize_window()  # 浏览器窗口最大化

在input输入框中输入数据

from selenium.webdriver import Chrome

driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe")
driver.maximize_window()  # 浏览器窗口最大化
ele = driver.find_element_by_id("kw")  # 找到id为kw的节点
ele.send_keys("数学")  # 向input输入框输入数据

模拟点击

from selenium.webdriver import Chrome

driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe")
driver.maximize_window()  # 浏览器窗口最大化
ele = driver.find_element_by_id("kw")  # 找到id为kw的节点
ele.send_keys("数学")  # 向input输入框输入数据
ele = driver.find_element_by_id('su')  # 找到id为su的节点（百度一下）
ele.click()  # 模拟点击

根据文本值查找节点

# 找到文本值为百度一下的节点
driver.find_element_by_link_text("百度一下") 
# 根据链接包含的文本获取元素列表，模糊匹配
driver.find_elements_by_partial_link_text("度一下")

获取当前节点的文本

ele.text # 获取当前节点的文本
ele.get_attribute("data-click")  # 获取到属性对应的value

打印当前网页的一些信息

print(driver.page_source)  # 打印网页的源码
print(driver.get_cookies())  # 打印出网页的cookie
print(driver.current_url)  # 打印出当前网页的url

关闭浏览器

driver.close()  # 关闭当前网页
driver.quit()  # 直接关闭浏览器

页面等待

from selenium.webdriver import Chrome
import time

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe")

driver.get("https://www.baidu.com/")
# time.sleep(1)
driver.implicitly_wait(5)  # 跟time.sleep类似，比time.sleep更加智能，不会被动的等待时间结束

wait = WebDriverWait(driver, 10)  # 等待时间
ele = wait.until(EC.presence_of_element_located((By.ID, "kw")))
ele.send_keys("数学")
wait = WebDriverWait(driver, 10)
ele = wait.until(EC.element_to_be_clickable((By.ID, 'su')))
ele.click()
time.sleep(3)
driver.close()

四、Selenium切换窗口

1. 获取当前所有的窗口

current_windows = driver.window_handles
#返回一个list.

2. 根据窗口索引进行切换

driver.switch_to.window(current_windows[0])

3. selenium切换iframe

driver.switch_to.frame("iframe的id")

4.切换进入alert

alert = driver.switch_to.alert()

五、Selenium滑动界面

from selenium.webdriver import Chrome
import time

driver = Chrome(executable_path=r"E:\python学习\python爬虫\chromedriver.exe")

driver.get(
    "https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=78000241_12_hao_pg&wd=selenium%20js%E6%BB%91%E5%8A%A8&fenlei=256&rsv_pq=8215ec3a00127601&rsv_t=a763fm%2F7SHtPeSVYKeWnxKwKBisdp%2FBe8pVsIapxTsrlUnas7%2F7Hoo6FnDp6WsslfyiRc3iKxP2s&rqlang=cn&rsv_enter=1&rsv_dl=tb&rsv_sug3=31&rsv_sug1=17&rsv_sug7=100&rsv_sug2=0&rsv_btype=i&inputT=9266&rsv_sug4=9770")
#  1.滚动到网页底部
js = "document.documentElement.scrollTop=800" 
# 执行js
driver.execute_script(js) 
time.sleep(1)
# 滚动到顶部
js = "document.documentElement.scrollTop=0" 
driver.execute_script(js)  # 执行js

time.sleep(1)
driver.close()

selenium的优缺点

selenium能够执行页面上的js，对于js渲染的数据和模拟登陆处理起来非常容易。
selenium由于在获取页面的过程中会发送很多请求，所以效率非常低，所以在很多时候需要酌情使用。

以上就是Python中Selenium如何使用，小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注亿速云行业资讯频道。

向AI问一下细节

Python中Selenium如何使用

Selenium介绍

安装

二、Chromedriver的介绍

三、Selenium的基本使用

四、Selenium切换窗口

五、Selenium滑动界面

selenium的优缺点

猜你喜欢

最新资讯

相关推荐

相关标签