python-爬取壁纸

这篇具有很好参考价值的文章主要介绍了python-爬取壁纸。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

代理池的,防止IP 被封

python-爬取壁纸,Python,python,开发语言

找到图片真实地址

现在看到的只是图片的预览地址 (previews)

python-爬取壁纸,Python,python,开发语言

1.检查:

python-爬取壁纸,Python,python,开发语言

2.鼠标变为箭头时查看网页源代码

python-爬取壁纸,Python,python,开发语言

关于怎样在源代码中找到图片的真实地址 ???

为什么在源代码界面 ctrl f 时候搜索的是 .png ???

首先图片地址是以 .jpg .png .jpeg 结尾

真实的图片地址是:

"contentUrl":"https://img3.wallspic.com/crops/0/5/0/6/7/176050/176050-old_paria_utah-paria-kanab-paria_river-towers_of_the_virgin-6319x4324.jpg"

用正则表达式匹配,只匹配高像素源图片

(r'contentUrl":"(https://img\d.wallspic.com/crops/.*?)"', response)

python-爬取壁纸,Python,python,开发语言

如果是下面的内容,则会连缩略图也匹配到

(r'"contentUrl":"(.*?)"',req)

python-爬取壁纸,Python,python,开发语言最终代码:

import requests
import re

url = 'https://wallspic.com/cn/album/ji_shu/for_desktop'

response = requests.get(url = url).text

contentUrl = re.findall(r'contentUrl":"(https://img\d.wallspic.com/crops/.*?)"', response)
j = 0
for i in contentUrl:
    j += 1
    Content = requests.get(url = i).content
    print(i)
    with open(f'Wallspic-{j}.jpg', mode = 'wb') as f:
        f.write(Content)
        print(f'[+] 壁纸{j}保存完成!')

最终结果是以.jpg的形式输出的

python-爬取壁纸,Python,python,开发语言

也可以以 .png的形式输出,.png是益处多多

Desktop Wallpapers - Download HD Desktop Backgrounds

https://wall.alphacoders.com/by_sub_category.php?id=170792&name=Black+Wallpapers

下载的慢可能是网速的原因,需要翻墙;或者给 idea 配置代理,

刷新电脑本地的线路,保持畅通。 

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

import requests
import re

def download_wallpapers(start_page, end_page):
    for page in range(start_page, end_page+1):
        url = f'https://wallspic.com/cn/album/dianying/popular?page={page}'
        response = requests.get(url=url).text
        contentUrl = re.findall(r'contentUrl":"(https://img\d.wallspic.com/crops/.*?)"', response)
        j = 0
        for i in contentUrl:
            j += 1
            Content = requests.get(url = i).content
            print(i)
            with open(f'p-{page}-{j}.jpg', mode = 'wb') as f:
                f.write(Content)
                print(f'[+] 壁纸{page}-{j}保存完成!')
# 下载第1页到第55页的壁纸
download_wallpapers(1, 55)

 

这段代码的作用是从wallspic.com网站下载电影壁纸,具体解读如下:文章来源地址https://www.toymoban.com/news/detail-758352.html

  1. 导入requests和re模块:
import requests
import re
  1. 定义一个函数download_wallpapers,该函数接受两个参数:起始页码start_page和结束页码end_page。
def download_wallpapers(start_page, end_page):
  1. 使用for循环遍历从start_page到end_page的所有页码。
for page in range(start_page, end_page+1):
  1. 构造每个页面的URL,并使用requests.get()方法获取页面的HTML文本。
url = f'https://wallspic.com/cn/album/dianying/popular?page={page}'
response = requests.get(url=url).text
  1. 使用正则表达式从HTML文本中提取出所有壁纸的下载链接。
contentUrl = re.findall(r'contentUrl":"(https://img\d.wallspic.com/crops/.*?)"', response)
  1. 使用for循环遍历所有壁纸的下载链接,并使用requests.get()方法下载每个壁纸。
for i in contentUrl:
    Content = requests.get(url = i).content
  1. 将每个壁纸保存到本地,并打印出保存完成的信息。
with open(f'p-{page}-{j}.jpg', mode = 'wb') as f:
    f.write(Content)
    print(f'[+] 壁纸{page}-{j}保存完成!')

到了这里,关于python-爬取壁纸的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【Python爬虫开发实战①】使用urllib以及XPath爬取可爱小猫图片

    个人主页 :为梦而生~ 关注我一起学习吧! 专栏 :python网络爬虫从基础到实战 欢迎订阅!后面的内容会越来越有意思~ 往期推荐 : 【Python爬虫开发基础⑦】urllib库的基本使用 【Python爬虫开发基础⑧】XPath库及其基本用法 我们在之前已经有8篇文章讲述基础知识了,下面我们

    2024年02月11日
    浏览(74)
  • 【Python爬虫开发实战②】使用urllib以及jsonpath爬取即将上映电影信息

    🚀 个人主页 :为梦而生~ 关注我一起学习吧! 💡 专栏 :python网络爬虫从基础到实战 欢迎订阅!后面的内容会越来越有意思~ 💡 往期推荐 : ⭐️首先,我们前面讲了多篇基础内容: 【Python爬虫开发基础④】爬虫原理 【Python爬虫开发基础⑤】HTML概述与基本标签详解 【P

    2024年02月12日
    浏览(48)
  • 用python语言爬虫爬取微博评论--上--初步爬虫(超详细版,大学生不骗大学生)

    目录 一、找到页面  二、学会使用检查元素 2.1 打开检查元素界面 2.2 找到所有评论所在的位置 2.2.1 搜索评论 2.2.2  找到data表 三、基础部分代码实现 ​​​​​​​ 全部已经更完(下面两个链接是中和下) https://blog.csdn.net/m0_68325382/article/details/137234661?spm=1001.2014.3001.5502 爬

    2024年04月10日
    浏览(56)
  • 用Python将女朋友的照片做成壁纸软件,实现桌面壁纸自动更换!

    话说兄弟们,女朋友生气了都是怎么哄的? 不会吧不会吧,不会有人还是单身狗吧!     算了,还是回到正题吧,再说我要挨打了~ 今天咱们来交流一下程序员是怎么哄女朋友的,话不多说直接开始! 1、环境 首先我们准备好环境和编辑器,我使用的是: Python 3.8 解释器 P

    2024年02月06日
    浏览(50)
  • Python实现的《桌面视频壁纸程序 Mili Wallpaper》

    目录 安装方法: 使用方法 占时停止更新 Mili Wallpaper 现版本:1.5.54更新了相应的新功能,修改了很多BUG提高了程序的稳定性。让动态视频壁纸不再收费!达到了真正的白嫖! 之前版本的Mili Wallpaper只是一个死板的gui(tkinter实现)。现版本将Gui界面缩小,右键窗口菜单样式供用户

    2023年04月15日
    浏览(61)
  • 使用python下载wallpaper Engine订阅的壁纸/视频

      在游戏平台steam上,有一个壁纸软件wallpaper Engine,人称小红车,里面有各种好看的动态壁纸和视频,可以给我们的电脑设置动态桌面,非常好用。   用过几次后,我有了一些痛点,就是软件只能启动的时候才有这个桌面壁纸(当然这非常合理),但是我很喜欢这张壁纸

    2024年02月03日
    浏览(198)
  • [Python小项目] 从桌面壁纸到AI绘画

    从桌面壁纸到AI绘画 由于生活和工作需要,小编要长时间的使用电脑,小编又懒,一个主题用半年的那种,所以桌面壁纸也是处于常年不更换的状态。即时改变主题也是在微软自带的壁纸中选择,而这些自带的壁纸早就已经看腻了。于是,问题产生了:如何让电脑自动变更自

    2024年02月08日
    浏览(44)
  • 【python+selenium】LOL全英雄全皮肤爬虫--给电脑每天换张壁纸

    很多英雄联盟的元老级玩家都认可 LOL 的美工做得很好,不乏玩家将英雄的皮肤设为手机、电脑的壁纸或个人社交账号的头像。 作为 LOL 发烧友,如果想每天换一张电脑壁纸,该如何爬取 LOL 全英雄的全部皮肤呢?由于皮肤数量过多,最好能按英雄名分文件夹存储,找起来也比

    2024年02月15日
    浏览(49)
  • 桌面太单调?一起用Python做个自定义动态壁纸,竟然还可以放视频!

    前言 前段时间,用PyQt5写了几篇文章,关于Python自制一款炫酷音乐播放器、自定义桌面动画挂件、车牌自动识别系统。今天就继续给大家分享一个实战案例,带大家一起用Python的PyQt5开发一个自定义动态桌面壁纸,好玩又有趣! 首先一起来看看最终实现的自定义动态壁纸效果

    2023年04月25日
    浏览(255)
  • python爬取微信小程序数据,python爬取小程序数据

    大家好,小编来为大家解答以下问题,python爬取微信小程序数据,python爬取小程序数据,现在让我们一起来看看吧! 最近需要获取微信小程序上的数据进行分析处理,第一时间想到的方式就是采用python爬虫爬取数据,尝试后发现诸多问题,比如无法获取目标网址、解析网址中

    2024年02月04日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包