问答网

当前位置: 首页 > 知识问答 > 如何提取网页中的图片

如何提取网页中的图片

知识问答 浏览3次

要提取网页中的图片,可以使用Python编程语言和相关库(如requests、BeautifulSoup和Pillow)进行操作,使用requests库获取网页内容,然后使用BeautifulSoup解析HTML,最后通过查找标签(如img)并获取其属性(如src)来提取图片链接,再次使用requests库下载图片并保存到本地,以下是一个简单的示例代码:

import requestsfrom bs4 import BeautifulSoupfrom PIL import Imagefrom io import BytesIOdef download_image(url, save_path):    response = requests.get(url)    with open(save_path, 'wb') as f:        f.write(response.content)def extract_images(url):    response = requests.get(url)    soup = BeautifulSoup(response.text, 'html.parser')    img_tags = soup.find_all('img')    img_urls = [img['src'] for img in img_tags if 'src' in img.attrs]        for img_url in img_urls:        image_name = img_url.split('/')[-1]        save_path = f'images/{image_name}'        download_image(img_url, save_path)if __name__ == '__main__':    url = 'https://www.example.com'    extract_images(url)

这段代码首先定义了一个名为download_image的函数,用于从给定的URL下载图片并将其保存到指定的路径,定义了一个名为extract_images的函数,用于从给定的网页URL中提取所有图片链接,在主程序中调用extract_images函数并传入目标网页的URL。