Python urllib模块学习

7月前作者：峙峙峙分类：Toy博客阅读(25) 违法举报

这篇具有很好参考价值的文章主要介绍了Python urllib模块学习。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

HTTP协议

HTTP 协议：一般指HTTP(超文本传输)协议。
HTTP是为Web浏览器和Web服务器之间的通信而设计的，基于TCP/IP通信协议嘞传递数据。

HTTP消息结构

客户端请求消息

客户端发送一个HTTP请求到服务器的请求消息包括以下格式

请求行(request line)
请求头(header)
空行
请求数据

Python urllib模块学习,学习

服务器相应消息

HTTP相应也由四个部分组成

状态行
消息报头
空行
响应正文

Python urllib模块学习,学习

HTTP响应头信息

HTTP请求头提供了关于请求，响应或者其他的发送实体的信息。
以下是一些例子

Allow 服务器支持哪些请求方法
Connect-Encoding 文档的编码方法
Connect-Length 表示内容长度
Connect-Type 表示后面的文档属于什么MIME类型。
- 该属性用于定义网络文件的类型和网页的编码例如Connect-Type: text/html; charset=utf-8
- MIME类型：描述消息内容类型的标准。通用结构type/subtype
Date 当前的GMT（格林威治标准时间）时间

HTTP请求方法

HTTP请求方法有很多种，其中1.0版本有 GET、POST、HEAD三种，1.1版本又新增了六种。

GET：请求指定的页面信息，并返回实体主体
HEAD：类似于GET请求，只不过返回的响应中没有具体内容，用于获取报头
POST：向指定资源提交数据进行处理请求。数据被包含在请求体中。请求可能导致新的资源的建立或已有资源的修改。

HTTP状态码

HTTP状态码由三个十进制数字组成，第一个十进制数字定义了状态码的类型，共五类。文章来源地址https://www.toymoban.com/news/detail-835877.html

1xx：信息，服务器收到请求，需要操作者继续执行操作
2xx：成功，操作被成功接收并处理
3xx：重定向
4xx：客户端错误
5xx：服务器错误

到了这里，关于Python urllib模块学习的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

关于pycharm在安装requests模块时出现：urllib3 v2.0 only supports OpenSSL 1.1.1+

原因：是由于urllib3模块的版本过高导致的解决办法： 1.file-setting-Project:project-python interpreter 2.点击右侧+号，在搜索框中输入urllib3 3.在左侧选中urllib3后，在右下方的specify verison下拉框中选择1.26版本 4.左下角选择install package即可

2024年02月12日
浏览(62)
python的网络请求库urllib、urllib2、urllib3、request的联系

1. 简介 urllib、urllib2、urllib3、request均能通过网络访问互联网上的资源文件，它们通过使用统一资源定位符（URL）并结合re模块完成很多意想不到的操作。 urllib：Python2和Python3内置的网络请求库，Python3的urllib实际是Python2版本中urllib和urllib2的合并 urllib2：它只存在于Python2版本的

2023年04月14日
浏览(32)
Python爬虫——Urllib

爬虫小白爬虫语法爬虫技术 1、什么是互联网爬虫通过一个程序，根据url进行爬取网页，获取游泳信息通过程序模拟浏览器，去向服务器发起请求，获取响应信息 2、爬虫核心爬取网页：爬取整个网页，包含了网页中所有内容解析数据：将网页中得到的数据进行解析难点

2024年02月13日
浏览(35)
[Python]爬虫基础——urllib库

urllib库是Python内置的标准库。包含以下四个模块： 1、request：模拟发送HTTP请求； 2、error：处理HTTP请求错误时的异常； 3、parse:解析、拆分、合并URL; 4、robotparser:解析网站的robots.txt文件案例：爬取知乎网站的数据首先要构造HTTP请求，然后将HTTP响应的各部分进行输出第一步

2024年02月03日
浏览(65)
Python网络爬虫库urllib详解

了解Python标准库中的urllib模块，掌握URL解析、发送HTTP请求、文件下载等操作。

2024年02月08日
浏览(32)
python urllib库使用方法

urllib库是 Python的一个第三方库，它提供了丰富的功能和强大的性能。Python版本为2.11,提供了在不同平台上运行的选项，其中包括用于桌面和移动设备的应用程序。与 pycharm和 libc等库不同， urllib不是为了构建桌面应用程序而设计的，但是它可以用于移动设备上的应用程序。

2023年04月09日
浏览(38)
【Python学习】Python学习15-模块

目录文章所属专区 Python学习本章节主要说明Python的模块。Python 模块(Module)，是一个 Python 文件，以 .py 结尾，包含了 Python 对象定义和Python语句。把相关的代码分配到一个模块里能让你的代码更好用，更易懂。模块能定义函数，类和变量，模块里也能包含可执行的代码。 su

2024年01月16日
浏览(27)
Python urllib2详解及实例

urllib2是Python的一个获取URLs(Uniform Resource Locators)的组件。他以urlopen函数的形式提供了一个非常简单的接口，这是具有利用不同协议获取URLs的能力，他同样提供了一个比较复杂的接口来处理一般情况，例如：基础验证，cookies,代理和其他。它们通过handlers和openers的对象提供。

2024年02月08日
浏览(31)
Python爬虫库之urllib使用详解

一、Python urllib库 Python urllib 库用于操作网页 URL，并对网页的内容进行抓取处理。 Python3 的 urllib。 urllib 包包含以下几个模块： urllib.request - 打开和读取 URL。 urllib.error - 包含 urllib.request 抛出的异常。 urllib.parse - 解析 URL。 urllib.robotparser - 解析 robots.txt 文件。二、urllib.r

2024年02月11日
浏览(32)
Python 爬虫之 urllib 包基本使用

urllib 是一个 python 内置包，不需要额外安装即可使用，包里面包含了以下几个用来处理 url 的模块： urllib.request，用来打开和读取 url，意思就是可以用它来模拟发送请求，就像在浏览器里输入网址然后敲击回车一样，获取网页响应内容。 urllib.error，用来处理 urllib.request 引起

2024年02月09日
浏览(43)