【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）

这篇具有很好参考价值的文章主要介绍了【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

🍇前言

本篇文章接《获取Chatgpt3.5免费接口文末付代码（过Authorization认证）》，由于上次更新了代码后，对方做了验证，而且验证码有点难识别，真人都有点难看明白，喜欢爬虫类文章的可以订阅我专栏哦
⭐⭐欢迎订阅⭐⭐ ⭐⭐欢迎订阅⭐⭐
🚀Python爬虫项目实战系列文章！！
⭐⭐欢迎订阅⭐⭐ ⭐⭐欢迎订阅⭐⭐
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）
例如：

🚀Python爬虫项目实战系列文章！！
⭐⭐欢迎订阅⭐⭐

【Python爬虫项目实战一】获取Chatgpt3.5免费接口文末付代码（过Authorization认证）
【Python爬虫项目实战二】Chatgpt还原验证算法-解密某宝伪知网数据接口

⭐⭐欢迎订阅⭐⭐

🍍验证码识别的几个方法

🥥百度AI开放平台

在对接之前，我们先看一下识别效果，可见效果一般，存在个别识别不出来，又因为需要付费于是不考虑
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）

🥥Ddddocr

之前在其他项目中，已经介绍过了Dddocr，可以参考我的文章
《Selenium验证码ddddocr识别：带带ddocr》

识别验证码，5行搞定

 ocr = ddddocr.DdddOcr()
    with open('image.jpg', 'rb') as f:
        img_bytes = f.read()
    res = ocr.classification(img_bytes)
    print(res)

效果和百度一样遇到几个畸形的就直接识别出错，可以看看我的截图
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）


{"msg":"操作成功","img":"","code":200,"captchaEnabled":true,"uuid":"d14f1de7a0b842cfae525f3389d00f86"}
识别结果：9t67
提取结果：9t6
字符串中不包含 +、-、* 或 / 符号
{"msg":"操作成功","img":"","code":200,"captchaEnabled":true,"uuid":"010ed8010fe241c9a8c2e8c0989f9084"}
识别结果：4j4e7
4j4
字符串中不包含 +、-、* 或 / 符号
{"msg":"操作成功","img":"","code":200,"captchaEnabled":true,"uuid":"623dd34830554da49911b2ae75507921"}
识别结果：3t03
3t0
字符串中不包含 +、-、* 或 / 符号
{"msg":"操作成功","img":"","code":200,"captchaEnabled":true,"uuid":"164524dd70e74ae18d3782d7887b8974"}
识别结果：1*37
提取结果：1*3
字符串中包含 +、-、* 或 / 符号

之前识别发现效果不理想，但是在验证码中，存在简单的验证码随机刷新，所以我的做法是：舍弃百度AI通过Ddddocr识别，识别过程中判断"+、-、*、/"逐步往下获取参数，具体可以往下看

🦑分析验证码位数

【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）

在上面的验证码中，都是10内的"+、-、、/“运算，所以只需要匹配”+、-、、/"左右的数字即可

🦑获取验证码接口

def get_captcha():
    headers = {
        'Accept': 'application/json, text/plain, */*',
        'Accept-Language': 'zh-CN,zh;q=0.9',
        'Connection': 'keep-alive',
        'Origin': 'https://openmao.panchuang.net',
        'Referer': 'https://openmao.panchuang.net/',
        'Sec-Fetch-Dest': 'empty',
        'Sec-Fetch-Mode': 'cors',
        'Sec-Fetch-Site': 'same-site',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',
        'sec-ch-ua': '"Google Chrome";v="111", "Not(A:Brand";v="8", "Chromium";v="111"',
        'sec-ch-ua-mobile': '?0',
        'sec-ch-ua-platform': '"Windows"',
    }

    response = requests.get('https://mapi.panchuang.net/api/user/captchaImage', headers=headers)
    print(response.text)
    return response.json()

🦑算法识别匹配

【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）

将获取到的验证码通过解析base64存放在根目录

def decode_base64_to_img(base64_str):
    img_data = base64.b64decode(base64_str)
    with open('image.jpg', 'wb') as f:
        f.write(img_data)
    img = Image.open('image.jpg')

Ddddocr识别，识别到后进行特征提取，提取完毕逐步分析，如果提取失败反复操作


def verification():
    # 验证码识别
    ocr = ddddocr.DdddOcr()
    with open('image.jpg', 'rb') as f:
        img_bytes = f.read()
    res = ocr.classification(img_bytes)
    print(res)
    text = res[:3]  # 提取前三位子串
    print(text)  # 输出：8*4
    if "+" in text or "-" in text or "*" in text or "/" in text:
        print("字符串中包含 +、-、* 或 / 符号")
        first_char = text[0]  # 第一位字符
        last_char = text[-1]  # 最后一位字符
        print("第一位字符：", first_char)
        print("最后一位字符：", last_char)
        if "+" in text:
            result=int(first_char)+int(last_char)
        if "-" in text:
            result=int(first_char)-int(last_char)
        if "*" in text:
            result=int(first_char)*int(last_char)
        if "/" in text:
            result=int(first_char)/int(last_char)
        print(f"计算结果为{result}")
    else:
        print("字符串中不包含 +、-、* 或 / 符号")
        result = get_captcha()
        # 转换本地
        decode_base64_to_img(result['img'])
        verification()

最后获得计算数据
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）

🦑请求登陆接口

观察login接口
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）

uuid是和验证码一起获取到的
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）
uuid用于定位图片id，带着计算结果和uuid去login接口请求即可

我将计算出来的uuid和验证码结果，显示出来进行构造，这里注释了请求，因为请求了就显示验证码过期
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）

 print(uuid)
 print(result_num)
    json_data = {
        'username': '****9',
        'password': '*****',
        'loginTypeEnum': 'ACCOUNT',
        'code': result_num,
        'uuid': uuid,
    }

    # response = requests.post('https://mapi.panchuang.net/api/user/login', headers=headers, json=json_data)
    # print(response.text)

通过拼接手动填上去验证最后获得token
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）

🍋总结：

以上就是今天的教程，代码审核通过后会放在评论区，该项目现在只是demo仅供提取计算验证码，如果需要Chatgpt3.5接口的可以留言哦，该接口现在用于本人账号对接自动回复，长期互动支持的可以互关哈

推荐我的爬虫文章
《记一次云之家签到抓包》
《记一次视频抓包m3u8解密过程》
《抓包部分软件时无网络+过代理检测解决办法安卓黄鸟httpcanary+vmos》
《Python】记录抓包分析自动领取芝麻HTTP每日免费IP（成品+教程）》
《某课抓包视频安卓手机：黄鸟+某课app+VirtualXposed虚拟框架》

推荐专栏：

《Python爬虫脚本项目实战》

该专栏往期文章：
《【Python爬虫项目实战一】获取Chatgpt3.5免费接口文末付代码（过Authorization认证）》

🥦如果感觉看完文章还不过瘾，欢迎查看我的其它专栏
🥦作者对python有很大的兴趣，完成过很多独立的项目：例如滇医通等等脚本，但是由于版权的原因下架了，爬虫这一类审核比较严谨，稍有不慎就侵权违规了，所以在保证质量的同时会对文章进行筛选

如果您对爬虫感兴趣请收藏或者订阅该专栏哦《Python爬虫脚本项目实战》，如果你有项目欢迎联系我，我会同步教程到本专栏！

🚀Python爬虫项目实战系列文章！！
⭐⭐欢迎订阅⭐⭐

⭐⭐欢迎订阅⭐⭐
【Python爬虫项目实战三】Ddddocr识别Ocr过开放猫验证码（接Authorization认证更新）文章来源地址https://www.toymoban.com/news/detail-426579.html