温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

selenium怎么执行js并绕过webdriver监测

发布时间:2022-04-12 13:40:34 来源:亿速云 阅读:275 作者:iii 栏目:开发技术

这篇文章主要介绍了selenium怎么执行js并绕过webdriver监测的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇selenium怎么执行js并绕过webdriver监测文章都会有所收获,下面我们一起来看看吧。

    selenium执行js

    优点:直接调用浏览器的环境
    障碍:绕过selenium监测
    原理:
    # 执行js代码
    bro.execute_script('js代码')

    常见的selenium监测手段

    正常登录 window.navigator.webdriver == undefined
    自动化的 window.navigator.webdriver == true
    
    
    除此之外,还有一些其它的标志性字符串(不同的浏览器可能会有所不同),常见的特征串如下所示:
    webdriver  
    __driver_evaluate  
    __webdriver_evaluate  
    __selenium_evaluate  
    __fxdriver_evaluate  
    __driver_unwrapped  
    __webdriver_unwrapped  
    __selenium_unwrapped  
    __fxdriver_unwrapped  
    _Selenium_IDE_Recorder  
    _selenium  
    calledSelenium  
    _WEBDRIVER_ELEM_CACHE  
    ChromeDriverw  
    driver-evaluate  
    webdriver-evaluate  
    selenium-evaluate  
    webdriverCommand  
    webdriver-evaluate-response  
    __webdriverFunc  
    __webdriver_script_fn  
    __$webdriverAsyncExecutor  
    __lastWatirAlert  
    __lastWatirConfirm  
    __lastWatirPrompt  
    $chrome_asyncScriptInfo  
    $cdc_asdjflasutopfhvcZLmcfl_  
    了解了这个特点之后,就可以在浏览器客户端JS中通过检测这些特征串来判断当前是否使用了selenium,并将检测结果附加到后续请求之中,这样服务端就能识别并拦截后续的请求。

    常用绕过selenium监测1

    正常登录 window.navigator.webdriver == undefined
    自动化的 window.navigator.webdriver == true
    
    from selenium import webdriver
    options = webdriver.ChromeOptions()
    # 此步骤很重要,设置为开发者模式,防止被各大网站识别出来使用了Selenium
    options.add_experimental_option('excludeSwitches', ['enable-automation'])
    #停止加载图片
    options.add_experimental_option("prefs", {"profile.managed_default_content_settings.images": 2})
    browser = webdriver.Chrome(options=options)
    browser.get('https://www.taobao.com/')

    常用绕过selenium监测2

    from selenium import webdriver
    chrome_options = webdriver.ChromeOptions()
    chrome_options.add_experimental_option('debuggerAddress','127.0.0.1:9222')
    browser=webdriver.Chrome(executable_path=r'C:\Users\TR\AppData\Local\Google\Chrome
    \Application\chromedriver.exe',chrome_options=chrome_options)
    browser.get('http://www.zhihu.com')
    
    终端输入如下指令:chrome.exe --remote-debugging-port=9222 --user-data-dir=“D:\cdsf”(需要谷歌驱动在系统环境变量下,然后再运行程序)
    remote-debugging-port是你代码中指定的端口debuggerAddress;executable_path是你谷歌驱动位置;user-data-dir随便指定一个目录就行

    常用绕过selenium监测3

    1.使用chrome的远程调试模式结合selenium来遥控chrome进行抓取,这样不会携带指纹信息
    
    步骤:
    
    - 使用调试模式手工启动chrome,进入chrome的安装路径,例如chrome装在 C:\program\google\chrome.exe下
    - 进入chrome安装路径
    - 执行命令:
    #注意端口不要被占用,防火墙要关闭,user-data-dir用来指明配置文件的路径
       chrome.exe --remote-debugging-port=9222 --user-data-dir="指向任意空文件夹"
    
    
    2.启动完·之后新建python文件
    运行代码:
    import requests
    from selenium import webdriver
    
    chrome_options = "C:\Users\Administrator\AppData\Local\Google\Chrome\Application\chrome.exe"
    chrome_options  = webdriver.ChromeOptions()
    chrome_options.add_experimental_option('debuggerAddress','10.8.13.95:9222')
    browser = webdriver.Chrome(chrome_options=chrome_options)
    browser.get("https://www.zhihu.com/signup?next=%2F")
    
    # chrome.exe --remote-debugging-port=9222 --user-data-dir="D:\moni"
    这样监测的就不是selenium模拟了

    常用绕过selenium监测4

    def selenium(js):
        option = webdriver.ChromeOptions()
        # option.add_argument('--headless')
        option.add_experimental_option('useAutomationExtension', False)
        option.add_experimental_option('excludeSwitches', ['enable-automation'])
        bro = webdriver.Chrome(executable_path='./chromedriver', options=option)  # 弹出浏览器,要给浏览器驱动的地址
         # 打开页面优先执行的js,execute_cdp_cmd
        bro.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
            "source": """
                Object.defineProperty(navigator, 'webdriver', {
                  get: () => undefined
                })
              """
        })
    
        bro.implicitly_wait(10)
        bro.get('https://www.toutiao.com/')
        time.sleep(5)
        print(bro.page_source)  # 获取页面返回的html代码
        bro.execute_script(js)
        input()

    关于“selenium怎么执行js并绕过webdriver监测”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“selenium怎么执行js并绕过webdriver监测”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注亿速云行业资讯频道。

    向AI问一下细节

    免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

    AI