Python3爬虫 – 下载反盗链图片的方式-StubbornHuang Blog

Python3爬虫 – 下载反盗链图片的方式

StubbornHuang Python 发布于2019-12-30 阅读 4,099次 0次评论 1次点赞本文共1107个字，阅读需要3分钟。

1 第一种方式：为Headers添加Referer字段

下载反盗链图片时，Headers除了必备的User-Agent字段之外，还需添加Referer字段，该字段为当前图片所在的Web页面链接。

1.2 在headers未加入Referer字段时

运行以下代码：

import requests
# 图片地址
url = 'https://stubbornhuangcomwordpressmedialibrary.oss-cn-shenzhen.aliyuncs.com/WordpressMediaLibrary/2019/12/201912260937073.png'
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}

reponse = requests.get(url,headers=headers)
print(reponse.status_code)

with open("1.jpg","wb")as f:
    f.write(reponse.content)
    reponse.close()

这是下载我个人站的图片，但是我在阿里OSS中配置了图片反盗链，所以如果我们以这种形式去下载图片，最后的响应代码一般都是403，这就是因为该资源进行了反盗链，那么自然图片也是无法下载成功的。

1.2 反盗链手段：在headers加入Referer字段，且该Referer字段对应的值为该资源的web页面链接时

运行以下代码：

import requests
# 图片地址
url = 'https://stubbornhuangcomwordpressmedialibrary.oss-cn-shenzhen.aliyuncs.com/WordpressMediaLibrary/2019/12/201912260937073.png'
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0',
    'Referer':'https://www.stubbornhuang.com/532/'
}

reponse = requests.get(url,headers=headers)
print(reponse.status_code)

with open("1.jpg","wb")as f:
    f.write(reponse.content)
    reponse.close()

结果发现，请求响应代码为200，说明我们请求成功，成功下载到了资源。

联系我

资助我们

随机推荐

Python3 – 正则表达式去除字符串中的特殊符号

资源分享 – A Tour of C++, First Edition 英文PDF下载

深度学习 – 图像标准化与归一化方法

资源分享 – Calculus for Computer Graphics , First Edition 英文PDF下载

资源分享 – Computer Animation – Algorithms and Techniques, Third Edition 英文PDF下载

Duilib – 超链接文本

最新评论

Python3爬虫 – 下载反盗链图片的方式

1 第一种方式：为Headers添加Referer字段

1.2 在headers未加入Referer字段时

1.2 反盗链手段：在headers加入Referer字段，且该Referer字段对应的值为该资源的web页面链接时

发表评论点击这里取消回复。

联系我

资助我们

随机推荐

Python3 – 正则表达式去除字符串中的特殊符号

资源分享 – A Tour of C++, First Edition 英文PDF下载

深度学习 – 图像标准化与归一化方法

资源分享 – Calculus for Computer Graphics , First Edition 英文PDF下载

资源分享 – Computer Animation – Algorithms and Techniques, Third Edition 英文PDF下载

Duilib – 超链接文本

最新评论

Python3爬虫 – 下载反盗链图片的方式

1 第一种方式：为Headers添加Referer字段

1.2 在headers未加入Referer字段时

1.2 反盗链手段：在headers加入Referer字段，且该Referer字段对应的值为该资源的web页面链接时

发表评论 点击这里取消回复。

大家都在搜

关注我们的公众号

发表评论点击这里取消回复。