爬虫cookie获取神器——EditThisCookie并魔改

这篇具有很好参考价值的文章主要介绍了爬虫cookie获取神器——EditThisCookie并魔改。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

爬虫cookie获取神器推荐——EditThisCookie且魔改

内容简介:
1、使用EditThisCookie
2、魔改源代码来实现更加高效的cookie保存。

EditThisCookie是一个cookie管理器。可以添加,删除,编辑,搜索,保护,并阻止cookie等等操作,并且这个工具是开源的。
GitHub链接:点击跳转

使用场景

对于爬虫玩家来说操作cookie是一件很繁琐的事情。
1、比如在复制一些HttpOnly为True 的cookie值的时。
2、比如想要修改cookie的值时,也不需要在进入浏览器调试工具去修改,或者是使用js代码修改。等等等奇奇怪怪的操作cookie场景

复制cookie

以百度指数为例,插件安装好后就可以在页面中打开,点开后需选择导出Cookie,就可以把cookie全部复制出来(包括设置了HttpOnly的字段)
editthiscookie,爬虫,浏览器插件,爬虫,源码软件

编辑cookie

编辑也很简单,直接点开下面,然后修改内容保存即可

editthiscookie,爬虫,浏览器插件,爬虫,源码软件

选项、屏蔽和锁定

这些高级选项可以在插件设置里面打开,然后去配置

editthiscookie,爬虫,浏览器插件,爬虫,源码软件

善用工具,修改源码实现高效场景

一键拿到cookie的工具有了,那我们复制到的cookie是不是还要手动保存或者设置到某个地方去,这样的话就太低效率了,而且只能自己手动操作,如果你有n个网址要爬岂不是很麻烦,所以我想了一个方法,就是在复制Cookie的位置,添加一点小功能:比如发送一个请求?

接口在接收到之后就可以做一些动作,比如保存进redis。

首先,我们需要调试这个插件

右键那个小饼干,选择审查弹出内容

editthiscookie,爬虫,浏览器插件,爬虫,源码软件
基本操作,定位这个复制cookie按钮的元素

editthiscookie,爬虫,浏览器插件,爬虫,源码软件

然后就可以在事件监听器里面找到对应的函数

editthiscookie,爬虫,浏览器插件,爬虫,源码软件

也可以直接全局搜索:$("#copyButton").unbind()

这个函数就是点击按钮,然后复制cookie动作,只需要在里面加一点请求代码,让它在获取到cookie前后发送一个请求

editthiscookie,爬虫,浏览器插件,爬虫,源码软件

修改后的函数代码

    $("#copyButton").unbind().click(function () {
        // copyToClipboard(cookiesToString.get(cookieList)); // 源代码
        var cookie = cookiesToString.get(cookieList)
        copyToClipboard(cookie);

        // 插件下的请求代码~
        var queryOptions = {active: true, currentWindow: true};
        chrome.tabs.query(queryOptions, 
            function (tabs) {
                var url = new URL(tabs[0].url);
                var host = url.hostname
                var xhr = new XMLHttpRequest();
                // 127.0.0.1可以改成域名或者是服务器ip
                xhr.open("POST", "http://127.0.0.1:8088/cookie/upload", true);
                xhr.setRequestHeader("Content-Type", "Application/Json");
                // 这里的请求参数根据自己的场景去设定
                var sendData = {"cookie": cookie, "host": host};
                xhr.send(JSON.stringify(sendData));
            }
        );

        // 下面代码不需要动
        data.nCookiesExported += cookieList.length;
        $("#copiedToast").fadeIn(function () {
            setTimeout(function () {
                $("#copiedToast").fadeOut();
            }, 2500);

        });
        $(this).animate({ backgroundColor: "#B3FFBD" }, 300, function () {
            $(this).animate({ backgroundColor: "#EDEDED" }, 500);
        });
    });

保存好后点击复制cookie的按钮,就可以在通过网络抓包看到成功发送了请求

editthiscookie,爬虫,浏览器插件,爬虫,源码软件

那么我们最终的效果就可以直接保存进redis(服务器接口自己设定)

editthiscookie,爬虫,浏览器插件,爬虫,源码软件
最后把修改后的js代码替换进插件源文件内就大功告成了。
还可以把这个插件直接给运营的同学使用,他们自己登陆后台自己一键发送cookie到服务器,再也不需要自己复制cookie保存了。

editthiscookie,爬虫,浏览器插件,爬虫,源码软件文章来源地址https://www.toymoban.com/news/detail-532507.html

到了这里,关于爬虫cookie获取神器——EditThisCookie并魔改的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 爬虫使用Selenium生成Cookie

    在爬虫的世界中,有时候我们需要模拟登录来获取特定网站的数据,而使用Selenium登录并生成Cookie是一种常见且有效的方法。本文将为你介绍如何使用Selenium进行登录,并生成Cookie以便后续的爬取操作。让我们一起探索吧! 一、Selenium简介 1. 定义:Selenium是一套自动化测试工具

    2024年02月08日
    浏览(44)
  • JS爬虫Cookie技巧,轻松掌握

    随着互联网的快速发展,获取网页数据已经成为许多人的需求。而JavaScript爬虫以其简单、高效的特点,成为了一种常见的数据获取工具。在使用JavaScript爬虫时,处理Cookie是一个重要的环节。本文将分享关于JS爬虫Cookie的经验和技巧,帮助读者更好地掌握这门技术。 一、Cook

    2024年02月09日
    浏览(47)
  • python爬虫,发送请求需要携带cookies

    此网站,需要先注册登录!!! 页面源代码: python代码: 运行结果:有数据 {\\\'next_max_id\\\': -1, \\\'items\\\': [], \\\'next_id\\\': -1} 此实例只是为了验证,某些网站反爬必须需要携带cookies。

    2024年01月16日
    浏览(84)
  • 爬虫入门06——了解cookie和session

    (1)什么是cookie,有什么作用 http请求是无状态的请求协议,不会记住用户的状态和信息,也不清楚你在这之前访问过什么 而当网站需要记录用户是否登录时,就需要在用户登录后创建一些信息并且要把这些信息记录在当前用户的浏览器中,记录的内容就是cookie 用户使用当

    2024年02月13日
    浏览(43)
  • Selenium用法详解【cookies操作】【JAVA爬虫】

    本文主要讲解 java 代码利用 Selenium 控制浏览器获取网站的 cookies ,对网站 cookies 的相关操作教程。 cookies 是识别用户登录与否的关键,爬虫中常常使用 selenium + jsoup 实现 cookie 持久化,即先用 selenium 模拟登陆获取 cookie ,再通过 jsoup 携带 cookie 进行请求。 webdriver 提供 cookies 的

    2023年04月18日
    浏览(43)
  • python爬虫-加速乐cookie混淆解析实例小记

    第一步:抓包工具第一次请求页面,得到响应。 本次我使用的fiddle进行抓包,可以直接请求得到响应,响应内容一样。 发现响应内容是不可直接用的内容,但是有明确的cookie,同时响应里的headers得到了set-cookie的值  第二步:抓包工具第二次请求。将第一次请求拿到的

    2024年02月15日
    浏览(42)
  • 一文详解Cookie以及Selenium自动获取Cookie

    以后数据获取途径以及数据资产绝对会是未来核心要素生产工具和资源之一,每个大模型都离不开更加精细化数据的二次喂养训练。不过现在来看收集大量数据的方法还是有很多途径的,有些垂直领域的专业数据是很难获取得到的,靠人力去搜寻相当费时费力,而且处理起来

    2024年02月04日
    浏览(55)
  • 【Cookie】获取 Cookie 时,出现 http: named cookie not present

    在Web开发时,我们经常与Cookie打交道,它被用作浏览器中存储的数据。Cookie是name:value的结构,name和value都为字符串。 cookie ,简而言之就是在本地计算机保存一些用户的历史信息。 我们先分析存储Cookie的流程: 1.在首次访问网站时,浏览器发送请求中并未携带Cookie; 2.服务

    2024年03月18日
    浏览(68)
  • 爬虫逆向实战(31)-某花顺行情中心(cookie、补环境)

    主页地址:某花顺 1、抓包 通过抓包可以发现数据接口是/page/2/ajax/1/ 2、判断是否有加密参数 请求参数是否加密? 无 请求头是否加密? 通过查看“标头”可以发现有一个 Hexin-V 加密参数,但是这个参数的值与cookie中 v 的值是一致的。 响应是否加密? 无 cookie是否加密? 有一

    2024年02月09日
    浏览(40)
  • 〖Python网络爬虫实战⑤〗- Session和Cookie介绍

    订阅:新手可以订阅我的其他专栏。免费阶段订阅量1000+                 python项目实战                  Python编程基础教程系列(零基础小白搬砖逆袭) 说明:本专栏持续更新中,目前专栏免费订阅,在转为付费专栏前订阅本专栏的,可以免费订阅付费专栏,

    2023年04月09日
    浏览(48)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包