温馨提示×

php网页爬虫 怎样设置 User-Agent

PHP
小樊
81
2024-12-12 18:58:58
栏目: 编程语言

在 PHP 网页爬虫中设置 User-Agent 可以模拟不同的浏览器访问目标网站,从而降低被目标网站屏蔽的风险。你可以使用 cURL 库来设置 User-Agent。以下是一个示例代码:

<?php
// 初始化 cURL 会话
$ch = curl_init();

// 设置目标 URL
$url = 'https://example.com';
curl_setopt($ch, CURLOPT_URL, $url);

// 设置 User-Agent
$user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3';
curl_setopt($ch, CURLOPT_USERAGENT, $user_agent);

// 设置返回结果而不是直接输出
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);

// 执行 cURL 会话
$response = curl_exec($ch);

// 检查是否有错误发生
if(curl_errno($ch)){
    echo 'CURL 错误: ' . curl_error($ch);
} else {
    // 处理响应数据
    echo $response;
}

// 关闭 cURL 会话
curl_close($ch);
?>

在这个示例中,我们首先初始化了一个 cURL 会话,然后设置了目标 URL 和 User-Agent。接着,我们使用 CURLOPT_RETURNTRANSFER 选项将响应结果作为字符串返回,而不是直接输出。最后,我们执行 cURL 会话并处理响应数据。

0