编写Python脚本批量下载DesktopNexus壁纸的教程
作者:goldensun 发布时间:2022-05-27 01:17:38
标签:Python
DesktopNexus 是我最喜爱的一个壁纸下载网站,上面有许多高质量的壁纸,几乎每天必上, 每月也必会坚持分享我这个月来收集的壁纸
但是 DesktopNexus 壁纸的下载很麻烦,而且因为壁纸会通过浏览器检测你当前分辨率来展示 合适你当前分辨率的壁纸,再加上是国外的网站,速度上很不乐观。
于是我写了个脚本,检测输入的页面中壁纸页面的链接,然后批量下载到指定文件夹中。
脚本使用 python 写的,所以需要机器上安装有 python 。
用法:
$ python desktop_nexus.py -p http://www.desktopnexus.com/tag/cat/ -s 1280x800 -o wallpapers
-p 包含 DesktopNexus 壁纸链接的页面,比如我的壁纸分享
-s 壁纸尺寸,可选,缺省为 1440x900
-o 壁纸输出的文件夹,可选,缺省为当前目录下的 wallpapers, 如果不存在会自动创建
代码:
#-*- coding: utf-8 -*-
from argparse import ArgumentParser
import os, re, sys
import urllib2, cookielib, urlparse
RE_WALLPAPER = r'http\:\/\/[^\/\.]+\.desktopnexus\.com\/wallpaper\/\d+\/'
CHUNK_SIZE = 1024 * 3
class DesktopNexus:
def __init__(self, page=None, size=None, output_dir=None):
self.page = page
self.size = size
self.output_dir = output_dir
def start(self):
print 'Making output directory:', self.output_dir
if not os.path.exists(self.output_dir):
os.makedirs(self.output_dir)
# Setup cookie
cookie = cookielib.CookieJar()
processer = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(processer)
urllib2.install_opener(opener)
self._read_page()
def _get_pic_info(self, url):
pic_id = url.split('/')[-2]
html = urllib2.urlopen(url).read()
pattern = r'<a href=\"\/get\/%s\/\?t=(?P<token>.*?)\"' % pic_id
match = re.search(pattern, html, flags=re.I|re.M|re.S)
if match:
return {'id': pic_id,
'token': match.group('token'),
'size': self.size}
else:
raise Exception('Cound not find wallpaper')
def _get_pic_file(self, pic_info):
redirect_url = 'http://www.desktopnexus.com/dl/inline/%(id)s/%(size)s/%(token)s' % pic_info
request = urllib2.urlopen(redirect_url)
return request.geturl()
def _download_pic(self, url):
pic_info = self._get_pic_info(url)
pic_file = self._get_pic_file(pic_info)
filename = os.path.split(urlparse.urlparse(pic_file).path)[-1]
filename = os.path.join(self.output_dir, filename)
with open(filename, 'wb') as output:
resp = urllib2.urlopen(pic_file)
total_size = int(resp.info().get('Content-Length'))
saved_size = 0.0
while saved_size != total_size:
chunk = resp.read(CHUNK_SIZE)
saved_size += len(chunk)
output.write(chunk)
self._print_progress('Saving file: %s' % filename, \
saved_size / total_size * 100)
def _print_progress(self, msg, progress):
sys.stdout.write('%-71s%3d%%\r' \
% (len(msg) <= 70 and msg or msg[:67] + '...', progress))
sys.stdout.flush()
if progress >= 100:
sys.stdout.write('\n')
def _read_page(self):
try:
print 'Fetching content:', self.page
html = urllib2.urlopen(self.page).read()
links = set(re.findall(RE_WALLPAPER, html, re.M|re.I))
count = len(links)
print 'Downloading wallpapers:'
for i, link in enumerate(links):
print '[%d/%d]: %s' % (i + 1, count, link)
try:
self._download_pic(link)
except Exception as e:
print 'Error downloading wallpaper.', e.message
except Exception as e:
print 'Error fetching content.', e
if __name__ == '__main__':
# Setup argparser
parser = ArgumentParser('python desktop_nexus.py')
parser.add_argument('-p', '--page', dest='page', required=True, \
help='specific a page that includes wallpaper list')
parser.add_argument('-s', '--size', dest='size', default='1440x900', \
help='specific the wallpaper size, default to 1440x900')
parser.add_argument('-o', '--output', dest='output_dir', default='wallpapers', \
help='specific the output directory, default to "wallpapers"')
args = parser.parse_args()
dn = DesktopNexus(**args.__dict__)
dn.start()
0
投稿
猜你喜欢
- 社会上的任何人,都不愿意自己给人留下难以交往的印象,就算是那些冷漠、寡情的人他们也在不断地寻求一种通道,达到与他人的交流和沟通。如果,在你与
- //-------------------------------------------- // 删除千分点。 //-----------
- 很简单的教程,献给喜欢SEO的朋友们。把article.asp?logID=26 替换成article.asp?/a
- 决定数据类型的第一步是定义所存数数据的分类: 数值型, 字符串型还是临时型等;除了一些特别的并不是那么直观的外, 这通常是很直观的。接下来是
- 阅读:Dreamweaver量身打造Wordpress留言板(一)虽然说在Dreamweaver量身打造Wordpress留言板(二)这一篇
- CSS换肤技术一直是一个比较热门的话题,通过给HTML文档不同的CSS样式应用,实现完全不同或风格迥异的页面效果。这样的技术一直为大家所津津
- CSS+DIV是网站标准(或称“WEB标准”)中常用的术语之一,通常为了说明与HTML网页设计语言中的表格(table)定位方式的区别,因为
- 随着 CSS3 渐入人心,Web 字体逐渐成为话题,这种即将让未来的 Web 更加丰富多彩的技术(或者说标准)拥有多种可能,虽然 .webf
- 无论使用int还是varchar,对于Status的多选查询都是不易应对的。举例,常规思维下对CustomerStatus的Enum设置如下
- 基本的网站页面设计元素布局比例统计,给大家做个参考,看看您的网站是否和下面的统计一致:标志图案:位置统计结果左上角84%右上角6%上方居中6
- /** * 对数据进行编码转换 * @param array/string $data  
- 手痒痒系列之简单的放大镜写了个放大镜功能,可以设置显示的宽高width,height显示的位置,float ‘left’ 'righ
- 有时候我们不希望浏览器使用缓存加快网页的显示,尤其是那些论坛之类的频繁更新内容的网页,在网上有说可以使用下面的方法来屏蔽缓存,但是我试了效果
- 方法一 通过GridView(简评:方法比较简单,但是只适合生成格式简单的Excel,且无法保留VBA代码),页面无刷新aspx.cs部分u
- 从PHP的5.4.0版本开始,PHP提供了一种全新的代码复用的概念,那就是Trait。Trait其字面意思是”特性”、”特点”,我们可以理解
- 本文实例讲述了php+html5基于websocket实现聊天室的方法。分享给大家供大家参考。具体如下:html5的websocket 实现
- 导言到目前为止的讨论编辑DataList的教程里,没有包含任何验证用户的输入,即使是用户非法输入— 遗漏了product的name或者负的p
- 代码如下:USE TestDB declare @conversation uniqueidentifier while exists (s
- 一、json_encode() 对变量进行JSON编码语法:json_encode($value[,$options=0])注意: 
- 内容摘要:严格地说,ASP 并不是一门编程语言,所以不存在类这一概念,我们这里说 ASP 类是指 A