十几行代码简单爬虫下载网易lofter图片

Muxxs
Muxxs 2018年02月20日
  • 在其它设备中阅读本文章

#coding=utf-8

from urllib import request

from bs4 import BeautifulSoup as bs

num=1# 每 +1 图片收集多加 10 个

num 这里,因为网址是 10 个一页,所以每页自动下载十个图片

main_word=[]for i in range(0,num):

resp=request.urlopen("http://hanyijie.lofter.com/?page="+str(i))

html_data=resp.read() hl=bs(html_data) photo=hl.select(".photo")

forx in photo:

url=str(x).split('href="')[1].split('"')[0]

resp = request.urlopen(url)

html_data = resp.read()

hl = bs(html_data)

img=str(hl.select(".imgclasstag")).split('bigimgsrc="')[1].split('"')[0].split("?")[0]

这里我并没有引入正则是因为这个规律很简单,一行就能解决问题

print(img)

import os,time

os.system("wget -P (目录)"+img)# 引用系统自带下载库下载