简单利用Python代码自动下载百度图片

所属分类:其他资源 围观人数:405 点赞:0次
手机浏览

扫一扫,直接在手机上打开

一个非常简单的入门爬虫

--------------------------------------------------------------------------------------------------------------------------------------------

import os
import requests
import re

keyWord = "杨超越" # 设置爬取图片的主题
number = 10       # 爬取图片数量
if not os.path.exists(keyWord):
    os.makedirs(keyWord)
url = r'http://image.baidu.com/search/flip?tn=baiduimage&ipn=r&ct=201326592&cl=2&lm=-1&st=-1&fm=result&fr=&sf=1&fmq' \
      r'=1497491098685_R&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&ie=utf-8&ctd' \
      r'=1497491098685%5E00_1519X735&word=' + keyWord
get = requests.get(url)
pciture_url = re.findall(r'objURL":"(.*?)",', get.text)
a = 1
for i in pciture_url:
    p_type = i.split('.')[-1]
    a += 1
    try:
        picture = requests.get(i, timeout=10)
        name = "%s/%s_%d.%s" % (keyWord, keyWord, a, p_type)
        with open(name, 'wb') as f:
            f.write(picture.content)
        print('第%d张图片正在下载' % a)
    except:
        print('第%d张图片下载失败!已跳过...' % a)
    if a >= number:
        break


--------------------------------------------------------------------------------------------------------------------------------------------
代码逻辑主要是爬取百度图片网站的网页源码,然后从源码中提取每张图片的地址链接,使用循环保存每一张图片。

可以将这份代码直接拷贝到python编辑器里,只需要修改keyWord变量和num变量,设置成自己想爬取的图片主题和数量就可以运行下载了


the end
免责声明:本文来自 阿怪资源网 发布,但不代表本站的观点和立场。
已有0次赞
我要评论 0条评论,0条回复
匿名用户
    热门评论
    最新评论
查看更多评论
Welcome

登录您的账号