Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)

这篇具有很好参考价值的文章主要介绍了Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


前言

在练习爬虫时,需要获取表单数据存入字典中,但是需要给原始数据一个个加单引号,相当麻烦,网上查找到的解决方法都不能够完全解决问题,于是我琢磨着自己解决了,现在就分享给大家

Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)


一. 解决方法

1.复制表单数据到Pycharm中

Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)

2. Ctrl+R 调出正则匹配工具栏

输入以下内容,并点亮图标

(\w+)\: ?\r?(.*\S?)
'$1':'$2',

提醒一下,后面的‘,’也要加上(并非多余)
Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)

3. 选中需要添加单引号的内容

点击全部替换
Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)

然后问题就解决了
Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)

二. 本方法优点和原理

1. 网络上其他的解决方法

参考网络上其他解决方法,与本方法相比,只是 正则表达式不同,在解决此问题时,大多数的正则表达式都是这样:
Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)
这种方法并不能解决问题,验证图如下
Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)
不仅没有检测到所有数据,而且添加的单引号也不完整。
也有这样的
Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)
Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)
Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)
同样也是检测不完整,虽然选中的加全了单引号,但是加在了前面,不美观

这些方法多多少少都有问题

原理:

.	匹配除换行符 \n 之外的任何单字符。要匹配 . ,请使用 \.*	匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 \*。
?	匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。要匹配 ? 字符,请使用 \?。
( )	标记一个子表达式的开始和结束位置。
$	匹配输入字符串的结尾位置。
\n	匹配一个换行符。等价于 \x0a 和 \cJ。
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\w	匹配字母、数字、下划线。等价于 [A-Za-z0-9_]
\	将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, 'n' 匹配字符 'n''\n' 匹配换行符。
+	匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"+ 等价于 {1,}

2. 此方法讲解

具体的意思就不再解释了,上面都有相应符号的解释,大家可以参考一下。
我就是把前面的识别一切字符的改成了只识别数字和字母,后面也多加了对空白和换行的识别。文章来源地址https://www.toymoban.com/news/detail-407118.html

到了这里,关于Python爬虫—为表单数据快速添加单引号(2021最有效解决方法)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • MATLAB字符串里怎么添加单引号

    引号里面嵌套单引号,内部的引号要连续敲两个单引号

    2023年04月09日
    浏览(23)
  • vue3,elementPlus和自己封装,点击 新增添加表单,删除表单,提交数据

    点击提交的打印效果 components/insertForm.vue 主文件引入 效果一样 *

    2024年02月16日
    浏览(28)
  • shell使用文件通配符{},变量自动添加单引号,无法识别问题

    脚本关键部分如下: 获取一周七天的日期,然后利用通配符,直接查看七天内的文件 weekdays=`/opt/uploadcheck/calculateDate.sh $start_week $end_week` weekdays=`echo $weekdays | awk \\\'{ gsub(/ /,\\\",\\\"); print $0 }\\\'` echo $weekdays zcat /opt/a_\\\"{$weekdays}\\\"_00_001.csv.gz 执行出现错误,通配符没有被解析,而是被当作整

    2024年02月10日
    浏览(44)
  • 如何用java快速去掉字符串前后的双引号

    你可以使用Java中的String类的trim()方法和replace()方法,将字符串前后的双引号去掉。具体步骤如下: 调用trim()方法去掉字符串前后的空格; 调用replace()方法,将字符串前后的双引号替换为空字符串,即去掉双引号。 以下是示例代码: 输出结果为:Hello, world!

    2024年02月11日
    浏览(40)
  • Python爬虫爬取知乎文章内容(解决最新js反爬2021.9 x-zse-96 2.0版本加密破解分析)...

    有个需求爬取知乎文章,正好记录下爬取过程以及出现问题并解决方法 我是在没有登录的情况下爬取文章的 本文仅供研究与学习使用 知乎现今的 x-zse 参数的加密方法已升级成了:x-zse-96 2.0版本。 来看这篇帖子的应该都知道,这个参数动态唯一,没有就拿不到api数据。 查阅

    2023年04月08日
    浏览(42)
  • python爬虫入门教程(非常详细):如何快速入门Python爬虫?

    示例示例Python爬虫入门教程什么是爬虫爬虫(又称网络爬虫)是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。它可以自动地抓取网页内容,并从中提取有用的数据,存储到本地文件或数据库中。 Python爬虫入门教程 1. 什么是爬虫爬虫(又称网络爬虫)是一种

    2024年02月10日
    浏览(37)
  • Python中的单引号、双引号、三引号

    在Python中,引号内的内容都是字符串类型的。而引号又有单引号、双引号、三引号,具体的用法以及注意点如下:         单引号和双引号都是用来表示字符串,在一般情况下两者没有任何差别,下面两句输出的结果都是 今天天气真好!         单引号双引号可以相

    2024年02月08日
    浏览(26)
  • 已解决Python.selenium爬虫必备设置永久禁止谷歌浏览器自动升级(亲测有效)

    问题描述:selenium框架自动化操作浏览器的时候,需要安装浏览器驱动 WebDriver ,而 WebDriver 驱动需要对应浏览器的版本才运行。但是我们常用的谷歌浏览器是有自动更新的,就会经常导致 WebDriver 版本和谷歌浏览器版本对应不上,运行代码就会出现如下报错信息。 每次去下载

    2024年02月10日
    浏览(36)
  • Python爬虫快速入门

    引入 定义url路径 进行请求,返回一个响应对象response 读取响应体read()以字节形式打印网页源码 转码 编码 文本–byte encode 解码 byte–文本 decode 写入 语法:with open (‘文件名’,‘w’,设定编码格式) as fp: fp.write(文本) w代表写入 读取 读取响应体内容并转为utf-8格式 读取状态 读取

    2024年01月24日
    浏览(27)
  • 快速上手Python爬虫:网络爬虫基础介绍及示例代码

    网络爬虫,又称为 Web 爬虫、网络蜘蛛、网络机器人,在英文中被称为 web crawler,是一种自动化程序,能够在互联网上自动获取数据、抓取信息,并将其存储在本地或远程数据库中。它可以帮助我们自动化处理大量数据,提高工作效率,更好地利用互联网资源。 现代互联网上

    2024年02月09日
    浏览(32)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包