温馨提示×

高级python爬虫如何进行API接口爬取

小樊
81
2024-12-12 04:27:45
栏目: 编程语言

要使用Python进行API接口爬取,您可以使用requests库来发送HTTP请求并处理响应。以下是一个简单的示例,展示了如何使用requests库从API接口获取数据:

  1. 首先,确保您已经安装了requests库。如果没有,请使用以下命令安装:
pip install requests
  1. 然后,编写一个Python脚本来发送GET请求并处理响应。例如,要从https://jsonplaceholder.typicode.com/todos/1获取数据,您可以使用以下代码:
import requests

# API接口URL
url = "https://jsonplaceholder.typicode.com/todos/1"

# 发送GET请求
response = requests.get(url)

# 检查请求是否成功
if response.status_code == 200:
    # 解析JSON数据
    data = response.json()
    print(data)
else:
    print(f"请求失败,状态码:{response.status_code}")
  1. 如果需要发送带有查询参数的请求,可以在URL中添加查询参数,并使用params参数传递它们:
import requests

# API接口URL
url = "https://jsonplaceholder.typicode.com/posts"

# 查询参数
params = {
    "userId": 1,
    "limit": 10
}

# 发送GET请求
response = requests.get(url, params=params)

# 检查请求是否成功
if response.status_code == 200:
    # 解析JSON数据
    data = response.json()
    print(data)
else:
    print(f"请求失败,状态码:{response.status_code}")
  1. 如果需要发送带有请求头的请求,可以使用headers参数传递它们:
import requests

# API接口URL
url = "https://jsonplaceholder.typicode.com/posts"

# 请求头
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"
}

# 发送GET请求
response = requests.get(url, headers=headers)

# 检查请求是否成功
if response.status_code == 200:
    # 解析JSON数据
    data = response.json()
    print(data)
else:
    print(f"请求失败,状态码:{response.status_code}")

这些示例展示了如何使用Python的requests库从API接口获取数据。您可以根据需要修改这些代码以满足您的爬虫需求。

0