如何用RoboBrowser登录和抓取数据

发布时间：2022-01-04 16:02:33 来源：亿速云阅读：131 作者：柒染栏目：大数据

这期内容当中小编将会给大家带来有关如何用RoboBrowser登录和抓取数据，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。

RoboBrowser是一个简单的Python库，用于在没有独立Web浏览器的情况下浏览Web。RoboBrowser可以获取页面，单击链接和按钮，然后填写并提交表单。如果您需要与没有API的Web服务进行交互，RoboBrowser可以提供很好的帮助。接下来看一个例子，使用前需要pip install robobrowser安装这个库：

import refrom robobrowser import RoboBrowser#创建RoboBrowserbr = RoboBrowser()#打开datacoup登录地址br.open("https://datacoup.com/signin")#获取登录的表单form = br.get_form()#填写表单中的邮箱和密码form['email'] = "FILL_USERNAME_IN"form['password'] = "FILL_PASSWORD_IN"#提交表单br.submit_form(form)#获取登录后的页面结果返回信息src = str(br.parsed())#匹配开始和结束的位置htmlstart = '<li class="header-bal">Earned: 'end = '</li>'#使用正则进行匹配 返回结果result = re.search('%s(.*)%s' % (start, end), src).group(1)
print(result)

第二个例子，访问一个音乐网站，模拟查询歌曲信息：

import refrom robobrowser import RoboBrowser#浏览Rap Genius网站browser = RoboBrowser(history=True)browser.open('http://rapgenius.com/')#获取表单form = browser.get_form(action='/search')print(form)                # <RoboForm q=>#输入查询关键词queen 提交表单form['q'].value = 'queen'browser.submit_form(form)#查询第一首歌曲songs = browser.select('.song_name')#访问歌曲连接地址browser.follow_link(songs[0])#查找样式lyrics的文本信息lyrics = browser.select('.lyrics')print(lyrics[0].text)      # \n[Intro]\nIs this the real life...
#返回查询结果页面browser.back()# 查询我最喜欢的歌曲browser.follow_link('death on two legs')
# 也可以使用正则进行查找lyrics = browser.find(class_=re.compile(r'\blyrics\b'))lyrics.text

上述就是小编为大家分享的如何用RoboBrowser登录和抓取数据了，如果刚好有类似的疑惑，不妨参照上述分析进行理解。如果想知道更多相关知识，欢迎关注亿速云行业资讯频道。

向AI问一下细节

如何用RoboBrowser登录和抓取数据

猜你喜欢

最新资讯

相关推荐

相关标签