温馨提示×

python实例爬取图片同时下载到指定的文件

小云
153
2024-02-01 18:05:50
栏目: 编程语言

下面是一个使用Python实现的简单爬取图片并下载到指定文件夹的示例代码:

import requests
import os

def download_image(url, save_dir):
    # 发送HTTP GET请求获取图片数据
    response = requests.get(url)
    
    # 获取图片名称
    image_name = url.split("/")[-1]
    
    # 拼接保存图片的完整路径
    save_path = os.path.join(save_dir, image_name)
    
    # 保存图片到指定文件夹
    with open(save_path, 'wb') as file:
        file.write(response.content)
    
    print(f"图片 {image_name} 下载完成!")

def crawl_images(url, save_dir):
    # 发送HTTP GET请求获取网页内容
    response = requests.get(url)
    
    # 提取网页中的图片链接
    image_urls = re.findall('<img.*?src="(.*?)".*?>', response.text, re.S)
    
    # 逐个下载图片
    for image_url in image_urls:
        # 判断图片链接是否为完整的URL地址
        if image_url.startswith("http"):
            download_image(image_url, save_dir)
        else:
            download_image(url + image_url, save_dir)

# 要爬取的网页地址
url = "http://example.com"
# 要保存图片的文件夹路径
save_dir = "/path/to/save/dir"

# 创建保存图片的文件夹
os.makedirs(save_dir, exist_ok=True)

# 开始爬取图片
crawl_images(url, save_dir)

请将 http://example.com 替换为你要爬取图片的网页地址,并将 /path/to/save/dir 替换为你要保存图片的文件夹路径。执行以上代码后,程序会从指定网页中爬取图片,并将其保存到指定文件夹中。

0