【网络安全带你练爬虫-100练】第14练:文件内容的读取、取出

这篇具有很好参考价值的文章主要介绍了【网络安全带你练爬虫-100练】第14练:文件内容的读取、取出。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

一、目标1:把文件内容遍历取出

二、目标2:把文件内容全部取出

三、网络安全O


一、目标1:把文件内容遍历取出

 (1)如果文件脚本在不同目录

file_path = "path/to/your/file.txt"  # 替换为你的文件路径
with open(file_path, "r") as file:
    # 逐行读取文件内容
    for line in file:
        # 处理每一行内容
        print(line)

(2)如果文件直接和脚本在同一目录

with open(file.txt, "r") as file:
    # 逐行读取文件内容
    for line in file:
        # 处理每一行内容
        print(line)


二、目标2:把文件内容全部取出

 (1)存放取出的元素

lines = []

(2)将目标文件内容的元素依次取出

(for循环)

    with open('test.csv', 'r', encoding='utf-8') as file:
        for line in file:

(3)所有元素依次添加进列表中

lines.append(line.strip())

(4)完整代码:

if __name__ == '__main__':
    lines = []
    with open('test.csv', 'r', encoding='utf-8') as file:
        for line in file:
            lines.append(line.strip())
            print(lines)
    print(lines[1])

(4)方法二:

使用readlines()方法将文件内容读取到列表中

with open(file_path, "r") as file:
    lines = file.readlines()
    # 循环遍历列表并处理每一行内容
    for line in lines:
        # 处理每一行内容
        print(line)

(5)运行结果

【网络安全带你练爬虫-100练】第14练:文件内容的读取、取出,【网络安全-带你练爬虫】,web安全,安全,爬虫

三、网络安全O

README.md · 书半生/网络安全知识体系-实战中心 - 码云 - 开源中国 (gitee.com)https://gitee.com/shubansheng/Treasure_knowledge/blob/master/README.md

GitHub - BLACKxZONE/Treasure_knowledgehttps://github.com/BLACKxZONE/Treasure_knowledge文章来源地址https://www.toymoban.com/news/detail-574126.html

到了这里,关于【网络安全带你练爬虫-100练】第14练:文件内容的读取、取出的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【网络安全带你练爬虫-100练】第10练:re的正则匹配、文件夹创建、图片下载

    目录 一、目标1:正则匹配图片的URL 二、目标2:创建文件夹 三、目标3:保存图片到test文件夹中  四、网络安全小圈子 URL位置 我们可以找到img都在这个标签里面     请求方法GET   提取URL位置 需要掌握的 目标标签如下: 需要提取的内容如下: (多加了一个为转义字

    2024年02月13日
    浏览(55)
  • 【网络安全带你练爬虫-100练】第15练:模拟用户登录

    目录 一、目标1:理清逻辑 二、目标2:将每一步用代码进行表示 三、网络安全O 模拟登录的基本流程 1、进入入口程序 2、读取目标URL 3、请求加上线程 4、确定请求数据包 5、请求格式的确认 6、数据的处理与判断 (顺序会进行标号) 对于不同的站点的登录 需要对数据包、请

    2024年02月15日
    浏览(41)
  • 【网络安全带你练爬虫-100练】第4练:添加异常处理代码

    目录 一、异常处理代码: 二、执行结果: 三、完整代码: 四、网络安全小圈子   (当代码越来越长的时候,异常处理代码有时候能起到很好的作用) (注:其中的cookie需要填自己的) (1)try-except搭配:try后面的代码是要监视异常的代码块,except后面的代码是

    2024年02月15日
    浏览(46)
  • 【网络安全带你练爬虫-100练】第2练:爬取指定位置数据

    目录 一、思路 二、工具 三、代码处理 第一部分:发起请求+接收响应(不过多讲) 第二部分:解析HTML页面+提取数据 第三部分:处理数据 分解步骤,化繁为简 爬虫分为五步走: 发起HTTP请求:爬虫使用HTTP协议向目标网址发送请求,请求获取特定的HTML页面。这可以通过使用

    2024年02月12日
    浏览(47)
  • 【网络安全带你练爬虫-100练】第1练:发送请求获取返回内容

    目录 一、前置知识1 二、前置知识2 requests库的7个主要方法 语法: 注解: 三、扩展工具 四、网络安全小圈子 顾名思义网络爬虫第一步,爬取目标 URL的网页的信息 可以使用 urllib.request 和 requests发送请求,然后返回对应的数据(py3) 1、urllib 库是 Python 内置的 2、requests 库是

    2024年02月12日
    浏览(43)
  • 【网络安全带你练爬虫-100练】第6练:内嵌发包提取数据

    目录 一、分析目标: 二、代码实现 目标1:对于捕获的URL内嵌发包 目标2:找到电话和邮箱的位置 目标3:提取电话和邮箱 三、完整代码 四、网络安全小圈子 (注:需要带上登录成功后的cookie发包) 点击进去爬取每个企业里面的电话、邮箱 (我们是来投简历的,切勿干非法

    2024年02月12日
    浏览(47)
  • 【网络安全带你练爬虫-100练】第11练:xpath快速定位提取数据

    目录 一、目标1:使用etree解析数据 二、目标2:使用xpath爬取指定数据 三、目标3:提取指定数据  四、网络安全小圈子 其余的不用过多介绍,前面的练习都给大家已经过了一遍 其中数据解析代码如下 对返回的内容进行UTF-8解码,不然会出现乱码 我们来爬一下这几个标题  

    2024年02月13日
    浏览(80)
  • 【网络安全带你练爬虫-100练】第5练:爬虫的翻页操作+错误情况过滤

    目录 一、翻页分析: 二、代码逻辑 1、入口程序修改 2、page参数传入 三、完整代码 1、运行结果 2、错误分析: 3、缺陷代码: 4、完善逻辑: 5、完善代码: (说在前面,任何逻辑都有很多方法实现,我们先从最笨的讲起) (注:其中的cookie需要填自己的) 通过对比第一页与

    2024年02月12日
    浏览(47)
  • 【网络安全带你练爬虫-100练】第8练:json数据的最小项提取

    目录 一、目标1:爬取指定json中数据 二、目标2:循环取json中数据 三、目标3:提取每个数据中的某一项 四、网络安全小圈子 爬取data里数据   核心代码: (1)json.loads()方法可用于解析有效的JSON字符串并将其转换为Python字典 (2)dirt1[\\\'data\\\']是打印json中的data部分 运行结果:

    2024年02月13日
    浏览(49)
  • 【网络安全带你练爬虫-100练】第22练:数据包中参数提取与处理

    目录 一、目标1:GET数据包的处理 1、GET数据包中参数的提取 2、GET请求中 统计参数个数 二、目标2:POST数据包的处理 1、post中参数个数的提取 2、POST请求中 统计参数个数 (与GET类似,就不再做叙述了)

    2024年02月10日
    浏览(52)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包