15. 我是怎么用一个特殊 Cookie ,限制住别人的爬虫的
创始人
2024-05-03 13:37:59
0

爬虫训练场,第15篇博客。
博客详细清单,参考 https://pachong.vip/blog
本次案例,用定值 Cookie 实现反爬

文章目录

    • Cookie 生成
    • Python Flask 框架生成 Cookie
    • Flask make_response 加载模板
    • Flask 判断指定 cookie 是否存在
    • 补充知识点

Cookie 生成

由于本案例需要用到一个特定的 Cookie ,所以我们需要提前将其生成,你可以直接设置一个固定的字符串,也可以使用 Python 加密模块来加密一段文本,例如本案例加密 梦想橡皮擦

下面是一个示例代码,展示了如何使用 Python 的 hashlib 模块进行加密:

import hashlib# 要加密的文本
text = "梦想橡皮擦"# 使用 sha256 算法进行加密
encrypted_text = hashlib.sha256(text.encode()).hexdigest()print(encrypted_text)

在这个例子中,我们使用了 hashlib 模块中的 sha256 算法对文本进行加密。这个算法生成了一个长度为 64 位的十六进制哈希值,用于表示加密后的文本。

注意,这个算法只能用于加密文本,而不能用于解密。因此,一旦文本被加密,就无法恢复成原来的文本,即不可逆加密/单项加密。

Python Flask 框架生成 Cookie

在 Python 的 Flask 框架中,可以使用 make_response 函数和 set_cookie 方法来生成一个 Cookie。

例如,下面的代码片段展示了如何在 Flask 中设置一个名为 story 的 Cookie,并将它的值设为前文建立的加密串。

from flask import Flask, make_responseapp = Flask(__name__)@app.route('/')
def index():resp = make_response('Setting a cookie')encrypted_text = hashlib.sha256(text.encode()).hexdigest()resp.set_cookie('story', encrypted_text)return resp

在这个例子中,我们使用 make_response() 函数创建了一个响应对象,然后使用 set_cookie() 方法来设置 cookie。最后,我们将响应对象返回给客户端。

注意,上面的代码仅创建了一个简单的 Cookie,它只有名称和值两个部分。你还可以使用其他可选参数来设置 Cookie 的其他属性,例如过期时间、域名等。

接下来为大家在补充一下 make_response() 相关知识。

Flask make_response 加载模板

在 Flask 中,你可以使用 make_response() 函数和模板系统来生成带有模板的响应。

下面是一个示例代码,展示了如何使用 make_response() 函数加载模板:

from flask import Flask, make_response, render_templateapp = Flask(__name__)@app.route('/')
def index():# 加载模板并渲染rendered_template = render_template('index.html', title='梦想橡皮擦')# 使用 make_response 函数创建响应resp = make_response(rendered_template)return resp

在这个例子中,我们首先使用 Flask 的 render_template() 函数加载并渲染了名为 index.html 的模板。然后我们使用 make_response() 函数创建了一个响应对象,并将渲染后的模板作为响应的内容。最后,我们返回了这个响应对象给客户端。

注意,你需要在 Flask 应用的模板目录中存在名为 index.html 的模板文件,才能正常使用上述代码。

然后我们将该视图函数补充完整,代码在 app/routes.py 文件中。

@app.route('/')
@app.route('/index')
def index():item = {"msg": "后台传递信息"}# 访问首页生成一个 Cookie 值,该值用于访问特定页面rendered_template = render_template('index.html', title='梦想橡皮擦')resp = make_response(rendered_template)text = "梦想橡皮擦"# 使用 sha256 算法进行加密encrypted_text = hashlib.sha256(text.encode()).hexdigest()resp.set_cookie('story', encrypted_text)return resp

此时当我们访问爬虫训练场首页的时候,就会在 Cookie 中写入一个加密之后的字符串。
通过开发者工具,可以查看到响应头。

我是怎么用一个特殊 Cookie ,限制住别人的爬虫的

最后一步,就是在 Python Flask 框架中判断刚刚的 Cookie 值,如果存在则响应数据,否则返回 403。

Flask 判断指定 cookie 是否存在

在 Python 的 Flask 框架中,你可以使用 request.cookies 属性来判断指定的 Cookie 是否存在。

例如,下面的代码片段展示了如何判断一个名为 story 的 Cookie 是否存在:

from flask import Flask, requestapp = Flask(__name__)@app.route('/')
def index():if 'story' in request.cookies:# 如果存在 'story' cookie,则执行相应操作# ...else:# 如果不存在 'story' cookie,则执行相应操作# ...

将代码补充完整,文件是 app/antispider/index.py

@antispider.route('/cookie_demo')
def cookie_demo():if 'story' in request.cookies:# 如果存在 'story' cookie,则执行相应操作# ...return render_template("antispider/cookie_demo.html")else:return "没有权限", 403

补充知识点

在 Python 的 Flask 框架中,除了使用 set_cookie() 方法设置 cookie 以外,还有其他几种操作 cookie 的方法。

下面是一些常用的操作 cookie 的方法:

  • 设置 cookie 的值:你可以使用 set_cookie() 方法来设置 cookie 的值。例如:
from flask import Flask, make_responseapp = Flask(__name__)@app.route('/')
def index():resp = make_response('Setting a cookie')resp.set_cookie('user', 'xiangpica')return resp
  • 获取 cookie 的值:你可以使用 request.cookies 字典来获取 cookie 的值。例如:
from flask import Flask, requestapp = Flask(__name__)@app.route('/')
def index():user = request.cookies.get('user')return user
  • 删除 cookie:你可以使用 set_cookie() 方法并将 cookie 的过期时间设为过去的时间来删除 cookie。例如:
from flask import Flask, make_responseapp = Flask(__name__)@app.route('/')
def index():resp = make_response('Deleting a cookie')resp.set_cookie('user', '', expires=0)return resp

本案例到此结束,已更新到 爬虫训练场 欢迎大家访问学习。
项目同步到代码仓库 https://gitcode.net/hihell/spider_playground

📢📢📢📢📢📢
💗 你正在阅读 【梦想橡皮擦】 的博客
👍 阅读完毕,可以点点小手赞一下
🌻 发现错误,直接评论区中指正吧
📆 橡皮擦的第 812 篇原创博客

从订购之日起,案例 5 年内保证更新

  • ⭐️ Python 爬虫 120,点击订购 ⭐️
  • ⭐️ 爬虫 100 例教程,点击订购 ⭐️

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
MFC文件操作  MFC提供了一个文件操作的基类CFile,这个类提供了一个没有缓存的二进制格式的磁盘...