ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

python爬取网站图片保存到本地文件夹

2022-04-29 09:00:10  阅读:232  来源: 互联网

标签:count python photo 爬取 文件夹 requests sel response


爬取的网站

https://wallpaperscraft.com/catalog/anime

爬取代码

# 导包
import os
import requests
import parsel
from parsel import Selector  

def download_onepagephoto(website_url,count):  # 下载一页图片
    # 用i暂存传输过来的count值
    i=count
    # 发送请求
    response = requests.get(website_url)
    response.encoding = response.apparent_encoding
    # 很关键的一步,构建Selector对象
    sel = Selector(response.text)
    # 获取到网页中样式为wallpapers__item类下a标签的href的值
    index = sel.css('.wallpapers__item a::attr(href)').getall()
    # 遍历进入每个图片
    for line in index:
        # 模拟进入另一个页面,如法炮制上述操作
        response = requests.get("https://wallpaperscraft.com"+line)
        response.encoding = response.apparent_encoding
        sel = Selector(response.text)
        index2 = sel.css('.wallpaper__placeholder a::attr(href)').getall()
        if len(index2)!=0:
            nameurl=index2[0]
            # 获取到图片链接,将其保存到同级目录本地photo文件夹
            photo=requests.get(nameurl).content
            with open("photo/"+str(i)+".jpg","wb") as fp:
                fp.write(photo)
            print(str(i)+" already success")
            i=i+1
    return i

count=1
#爬取第一页
count=download_onepagephoto("https://wallpaperscraft.com/catalog/anime/1920x1080",count)
#爬取第二页及以后
for temp in range(2,174):
    count=download_onepagephoto("https://wallpaperscraft.com/catalog/anime/1920x1080/page"+str(temp),count)
    print("第"+str(temp)+"页图片爬取完成")



【创作不易,望点赞收藏,若有疑问,请评论,谢谢】

标签:count,python,photo,爬取,文件夹,requests,sel,response
来源: https://www.cnblogs.com/dongxuelove/p/16205341.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有