HTTP 协议详解(图文介绍)

这篇具有很好参考价值的文章主要介绍了HTTP 协议详解(图文介绍)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

当今web程序的开发技术真是百家争鸣,ASP.NET, PHP, JSP,Perl, AJAX 等等。 无论Web技术在未来如何发展,理解Web程序之间通信的基本协议相当重要, 因为它让我们理解了Web应用程序的内部工作. 本文将对HTTP协议进行详细的实例讲解,内容较多,希望大家耐心看。也希望对大家的开发工作或者测试工作有所帮助。使用Fiddler工具非常方便地捕获HTTP Request和HTTP Response,  关于Fiddler工具的用法,请看我另一篇博客[Fiddler 教程]

  阅读目录

  1. 什么是HTTP协议
  2. Web服务器,浏览器,代理服务器
  3. URL详解
  4. HTTP协议是无状态的
  5. HTTP消息的结构
  6. Get和Post方法的区别
  7. 状态码
  8. HTTP Request header
  9. HTTP Response header
  10. HTTP协议是无状态的和Connection: keep-alive的区别


  什么是HTTP协议

  协议是指计算机通信网络中两台计算机之间进行通信所必须共同遵守的规定或规则,超文本传输协议(HTTP)是一种通信协议,它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器

  目前我们使用的是HTTP/1.1 版本

  Web服务器,浏览器,代理服务器

  当我们打开浏览器,在地址栏中输入URL,然后我们就看到了网页。 原理是怎样的呢?

  实际上我们输入URL后,我们的浏览器给Web服务器发送了一个Request, Web服务器接到Request后进行处理,生成相应的Response,然后发送给浏览器, 浏览器解析Response中的HTML,这样我们就看到了网页,过程如下图所示

  我们的Request 有可能是经过了代理服务器,最后才到达Web服务器的。

  过程如下图所示

  代理服务器就是网络信息的中转站,有什么功能呢?

  1. 提高访问速度, 大多数的代理服务器都有缓存功能。

  2. 突破限制, 也就是翻墙了

  3. 隐藏身份。

  URL详解

  URL(Uniform Resource Locator) 地址用于描述一个网络上的资源,  基本格式如下

schema://host[:port#]/path/.../[;url-params][?query-string][#anchor]

  scheme               指定低层使用的协议(例如:http, https, ftp)

  host                   HTTP服务器的IP地址或者域名

  port#                 HTTP服务器的默认端口是80,这种情况下端口号可以省略。如果使用了别的端口,必须指明,例如 http://www.cnblogs.com:8080/

  path                   访问资源的路径

  url-params

  query-string       发送给http服务器的数据

  anchor-             锚

  URL 的一个例子

http://www.mywebsite.com/sj/test;id=8079?name=sviergn&x=true#stuff

Schema: http

host: www.mywebsite.com

path: /sj/test

URL params: id=8079

Query String: name=sviergn&x=true

Anchor: stuff

  HTTP协议是无状态的

  http协议是无状态的,同一个客户端的这次请求和上次请求是没有对应关系,对http服务器来说,它并不知道这两个请求来自同一个客户端。 为了解决这个问题, Web程序引入了Cookie机制来维护状态.

  HTTP消息的结构

  先看Request 消息的结构,   Request 消息分为3部分,第一部分叫请求行, 第二部分叫http header, 第三部分是body. header和body之间有个空行, 结构如下图

  第一行中的Method表示请求方法,比如"POST","GET",  Path-to-resoure表示请求的资源, Http/version-number 表示HTTP协议的版本号

  当使用的是"GET" 方法的时候, body是为空的

  比如我们打开博客园首页的request 如下

GET http://www.cnblogs.com/ HTTP/1.1

Host: www.cnblogs.com

  我们用Fiddler 捕捉一个博客园登录的Request 然后分析下它的结构, 在Inspectors tab下以Raw的方式可以看到完整的Request的消息,   如下图

  我们再看Response消息的结构, 和Request消息的结构基本一样。 同样也分为三部分,第一部分叫request line, 第二部分叫request header,第三部分是body. header和body之间也有个空行,  结构如下图

  HTTP/version-number表示HTTP协议的版本号,  status-code 和message 请看下节[状态代码]的详细解释.

  我们用Fiddler 捕捉一个博客园首页的Response然后分析下它的结构, 在Inspectors tab下以Raw的方式可以看到完整的Response的消息,   如下图

  Get和Post方法的区别

  Http协议定义了很多与服务器交互的方法,最基本的有4种,分别是GET,POST,PUT,DELETE. 一个URL地址用于描述一个网络上的资源,而HTTP中的GET, POST, PUT, DELETE就对应着对这个资源的查,改,增,删4个操作。 我们最常见的就是GET和POST了。GET一般用于获取/查询资源信息,而POST一般用于更新资源信息.

  我们看看GET和POST的区别

  1. GET提交的数据会放在URL之后,以?分割URL和传输数据,参数之间以&相连,如EditPosts.aspx?name=test1&id=123456.  POST方法是把提交的数据放在HTTP包的Body中.

  2. GET提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST方法提交的数据没有限制.

  3. GET方式需要使用Request.QueryString来取得变量的值,而POST方式通过Request.Form来获取变量的值。

  4. GET方式提交数据,会带来安全问题,比如一个登录页面,通过GET方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码.

  状态码

  Response 消息中的第一行叫做状态行,由HTTP协议版本号, 状态码, 状态消息 三部分组成。

  状态码用来告诉HTTP客户端,HTTP服务器是否产生了预期的Response.

  HTTP/1.1中定义了5类状态码, 状态码由三位数字组成,第一个数字定义了响应的类别

  1XX  提示信息 - 表示请求已被成功接收,继续处理

  2XX  成功 - 表示请求已被成功接收,理解,接受

  3XX  重定向 - 要完成请求必须进行更进一步的处理

  4XX  客户端错误 -  请求有语法错误或请求无法实现

  5XX  服务器端错误 -   服务器未能实现合法的请求

  看看一些常见的状态码

  200 OK

  最常见的就是成功响应状态码200了, 这表明该请求被成功地完成,所请求的资源发送回客户端

  如下图, 打开博客园首页

  302 Found

  重定向,新的URL会在response中的Location中返回,浏览器将会使用新的URL发出新的Request。

  例如在IE中输入http://www.google.com. HTTP服务器会返回304, IE取到Response中Location header的新URL, 又重新发送了一个Request.

  304 Not Modified

  代表上次的文档已经被缓存了, 还可以继续使用,

  例如打开博客园首页, 发现很多 Response 的status code 都是304

  提示: 如果你不想使用本地缓存可以用Ctrl+F5强制刷新页面

  400 Bad Request  客户端请求与语法错误,不能被服务器所理解

  403 Forbidden 服务器收到请求,但是拒绝提供服务

  404 Not Found

  请求资源不存在(输错了URL)

  比如在IE中输入一个错误的URL, http://www.cnblogs.com/tesdf.aspx

  500 Internal Server Error 服务器发生了不可预期的错误

  503 Server Unavailable 服务器当前不能处理客户端的请求,一段时间后可能恢复正常

  HTTP Request header

  使用Fiddler 能很方便的查看Reques header, 点击Inspectors tab -> Request tab -> headers  如下图所示.

  header 有很多,比较难以记忆,我们也按照Fiddler那样把header 进行分类,这样比较清晰也容易记忆。

  Cache 头域

  If-Modified-Since

  作用: 把浏览器端缓存页面的最后修改时间发送到服务器去,服务器会把这个时间与服务器上实际文件的最后修改时间进行对比。如果时间一致,那么返回304,客户端就直接使用本地缓存文件。如果时间不一致,就会返回200和新的文件内容。客户端接到之后,会丢弃旧文件,把新文件缓存起来,并显示在浏览器中。

  例如:If-Modified-Since: Thu, 09 Feb 2012 09:07:57 GMT

  实例如下图

  If-None-Match

  作用: If-None-Match和ETag一起工作,工作原理是在HTTP Response中添加ETag信息。 当用户再次请求该资源时,将在HTTP Request 中加入If-None-Match信息(ETag的值)。如果服务器验证资源的ETag没有改变(该资源没有更新),将返回一个304状态告诉客户端使用本地缓存文件。否则将返回200状态和新的资源和Etag.  使用这样的机制将提高网站的性能

  例如: If-None-Match: "03f2b33c0bfcc1:0"

  实例如下图

  Pragma

  作用: 防止页面被缓存, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一样

  Pargma只有一个用法, 例如: Pragma: no-cache

  注意: 在HTTP/1.0版本中,只实现了Pragema:no-cache, 没有实现Cache-Control

  Cache-Control

  作用: 这个是非常重要的规则。 这个用来指定Response-Request遵循的缓存机制。各个指令含义如下

  Cache-Control:Public   可以被任何缓存所缓存()

  Cache-Control:Private     内容只缓存到私有缓存中

  Cache-Control:no-cache  所有内容都不会被缓存

  还有其他的一些用法, 我没搞懂其中的意思, 请大家参考其他的资料

  Client 头域

  Accept

  作用: 浏览器端可以接受的媒体类型,

  例如:  Accept: text/html  代表浏览器可以接受服务器回发的类型为 text/html  也就是我们常说的html文档,

  如果服务器无法返回text/html类型的数据,服务器应该返回一个406错误(non acceptable)

  通配符 * 代表任意类型

  例如  Accept: */*  代表浏览器可以处理所有类型,(一般浏览器发给服务器都是发这个)

  Accept-Encoding:

  作用: 浏览器申明自己接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(gzip,deflate),(注意:这不是只字符编码);

  例如: Accept-Encoding: gzip, deflate

  Accept-Language

  作用: 浏览器申明自己接收的语言。 

  语言跟字符集的区别:中文是语言,中文有多种字符集,比如big5,gb2312,gbk等等;

  例如: Accept-Language: en-us

  User-Agent

  作用:告诉HTTP服务器, 客户端使用的操作系统和浏览器的名称和版本.

  我们上网登陆论坛的时候,往往会看到一些欢迎信息,其中列出了你的操作系统的名称和版本,你所使用的浏览器的名称和版本,这往往让很多人感到很神奇,实际上,服务器应用程序就是从User-Agent这个请求报头域中获取到这些信息User-Agent请求报头域允许客户端将它的操作系统、浏览器和其它属性告诉服务器。

  例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

  Accept-Charset

  作用:浏览器申明自己接收的字符集,这就是本文前面介绍的各种字符集和字符编码,如gb2312,utf-8(通常我们说Charset包括了相应的字符编码方案);

  例如:

  Cookie/Login 头域

  Cookie:

  作用: 最重要的header, 将cookie的值发送给HTTP 服务器

  Entity头域

  Content-Length

  作用:发送给HTTP服务器数据的长度。

  例如: Content-Length: 38

  Content-Type

  作用:

  例如:Content-Type: application/x-www-form-urlencoded

  Miscellaneous 头域

  Referer:

  作用: 提供了Request的上下文信息的服务器,告诉服务器我是从哪个链接过来的,比如从我主页上链接到一个朋友那里,他的服务器就能够从HTTP Referer中统计出每天有多少用户点击我主页上的链接访问他的网站。

  例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT

  Transport 头域

  Connection

  例如: Connection: keep-alive   当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接

  例如:  Connection: close  代表一个Request完成后,客户端和服务器之间用于传输HTTP数据的TCP连接会关闭, 当客户端再次发送Request,需要重新建立TCP连接。

  Host(发送请求时,该报头域是必需的)

  作用: 请求报头域主要用于指定被请求资源的Internet主机和端口号,它通常从HTTP URL中提取出来的

  例如: 我们在浏览器中输入:http://www.guet.edu.cn/index.html

  浏览器发送的请求消息中,就会包含Host请求报头域,如下:

  Host:http://www.guet.edu.cn

  此处使用缺省端口号80,若指定了端口号,则变成:Host:指定端口号

HTTP Response header

  同样使用Fiddler 查看Response header, 点击Inspectors tab ->Response tab-> headers  如下图所示

  我们也按照Fiddler那样把header 进行分类,这样比较清晰也容易记忆。

  Cache头域

  Date

  作用:  生成消息的具体时间和日期

  例如: Date: Sat, 11 Feb 2012 11:35:14 GMT 

  Expires

  作用: 浏览器会在指定过期时间内使用本地缓存

  例如: Expires: Tue, 08 Feb 2022 11:35:14 GMT

  Vary

  作用:

  例如: Vary: Accept-Encoding

  Cookie/Login 头域

  P3P

  作用: 用于跨域设置Cookie, 这样可以解决iframe跨域访问cookie的问题

  例如: P3P: CP=CURa ADMa DEVa PSAo PSDo OUR BUS UNI PUR INT DEM STA PRE COM NAV OTC NOI DSP COR

  Set-Cookie

  作用: 非常重要的header, 用于把cookie 发送到客户端浏览器, 每一个写入cookie都会生成一个Set-Cookie.

  例如: Set-Cookie: sc=4c31523a; path=/; domain=.acookie.taobao.com

  Entity头域

  ETag

  作用:  和If-None-Match 配合使用。 (实例请看上节中If-None-Match的实例)

  例如: ETag: "03f2b33c0bfcc1:0"

  Last-Modified:

  作用: 用于指示资源的最后修改日期和时间。(实例请看上节的If-Modified-Since的实例)

  例如: Last-Modified: Wed, 21 Dec 2011 09:09:10 GMT

  Content-Type

  作用:WEB服务器告诉浏览器自己响应的对象的类型和字符集,

  例如:

  Content-Type: text/html; charset=utf-8

  Content-Type:text/html;charset=GB2312

  Content-Type: image/jpeg

  Content-Length

  指明实体正文的长度,以字节方式存储的十进制数字来表示。在数据下行的过程中,Content-Length的方式要预先在服务器中缓存所有数据,然后所有数据再一股脑儿地发给客户端。

  例如: Content-Length: 19847

  Content-Encoding

  WEB服务器表明自己使用了什么压缩方法(gzip,deflate)压缩响应中的对象。

  例如:Content-Encoding:gzip

  Content-Language

  作用: WEB服务器告诉浏览器自己响应的对象的语言者

  例如: Content-Language:da

  Miscellaneous 头域

  Server:

  作用:指明HTTP服务器的软件信息

  例如:Server: Microsoft-IIS/7.5

  X-AspNet-Version:

  作用:如果网站是用ASP.NET开发的,这个header用来表示ASP.NET的版本

  例如: X-AspNet-Version: 4.0.30319

  X-Powered-By:

  作用:表示网站是用什么技术开发的

  例如: X-Powered-By: ASP.NET

  Transport头域

  Connection

  例如: Connection: keep-alive   当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接

  例如:  Connection: close  代表一个Request完成后,客户端和服务器之间用于传输HTTP数据的TCP连接会关闭, 当客户端再次发送Request,需要重新建立TCP连接。

  Location头域

  Location

  作用: 用于重定向一个新的位置, 包含新的URL地址

  实例请看304状态实例

  HTTP协议是无状态的和Connection: keep-alive的区别

  无状态是指协议对于事务处理没有记忆能力,服务器不知道客户端是什么状态。从另一方面讲,打开一个服务器上的网页和你之前打开这个服务器上的网页之间没有任何联系。

  HTTP是一个无状态的面向连接的协议,无状态不代表HTTP不能保持TCP连接,更不能代表HTTP使用的是UDP协议(无连接)。

  从HTTP/1.1起,默认都开启了Keep-Alive,保持连接特性,简单地说,当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的连接。

  Keep-Alive不会永久保持连接,它有一个保持时间,可以在不同的服务器软件(如Apache)中设定这个时间。文章来源地址https://www.toymoban.com/news/detail-480518.html

到了这里,关于HTTP 协议详解(图文介绍)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • HTTP协议详解之HTTP/1.1

    目录 一、协议概述 二、HTTP请求与响应 2.1 请求/响应过程 2.2 请求/响应报文 2.2.1 请求报文 2.2.2 响应报文 2.2.3 URI和URL 2.2.4 常用头部字段 2.3 请求方法 2.3.1 OPTIONS方法 2.3.2 GET方法 2.3.3 HEAD方法 2.3.4 POST方法 2.3.5 PUT方法 2.3.6 DELETE方法 2.3.7 TRACE方法 2.3.8 CONNECT方法 2.3.9 GET方法和

    2024年02月04日
    浏览(29)
  • 网络协议HTTP/1、HTTP/2 及 HTTP/3详解

    目录 概述  一、发展史 HTTP/1.1  Keep-alive  动静分离  HTTP/2 二进制传输   多路复用 Header 压缩 服务端 Push  HTTP/3 QUIC  多路复用 0-RTT 纠错机制 三、小结 HTTP(Hyper Text Transformer Protocol,超文本传输协议)是一种通信协议,它允许将超文本标记语言(HTML)文档从Web服务器传送到

    2024年02月02日
    浏览(42)
  • 网络协议 - HTTP 协议详解

    HTTP 协议详解,web开发必备。 URI 包含 URL 和 URN,目前 WEB 只有 URL 比较流行,所以见到的基本都是 URL。 URI(Uniform Resource Identifier,统一资源标识符) URL(Uniform Resource Locator,统一资源定位符) URN(Uniform Resource Name,统一资源名称) 1. 请求报文 2. 响应报文 客户端发送的 请求报文 第

    2024年02月04日
    浏览(40)
  • HTTP超文本传输协议介绍

    转自:微点阅读  https://www.weidianyuedu.com HTTP 的全称是 Hyper Text Transfer Protocol,中文名叫做超文本传输协议,HTTP协议是用于从网络传输超文本数据到本地浏览器的传送协议,它能保证传送高效而准确地传送超文本文档。 HTTP、HTTPS HTTP 的全称是 Hyper Text Transfer Protocol,中文名叫

    2024年01月16日
    浏览(33)
  • 计算机网络 - 应用层http协议 - http报文格式介绍(1)

    本篇认识和理解应用层中的http协议,了解抓包工具并进行使用,认识请求报文与响应报文,了解报文中基本键值对意思例如:Set-Cookie, 状态码等,如有错误,请在评论区指正,让我们一起交流,共同进步! 本文开始 ① 根据输入的url,在域名系统DNS中进行解析获取对应的服务

    2024年02月12日
    浏览(30)
  • 【HTTP详解】HTTP协议、TCP/IP、TCP协议究竟是什么?

    部分资料来源: 《图解HTTP》 HTTP(Hypertext Transfer Protocol) 是一种用于在网络上传输数据的协议 ,它是万维网的基础。HTTP使用 客户端-服务器模型 ,客户端向服务器发送请求,服务器返回响应。HTTP使用 TCP 作为其 传输协议 ,它默认使用端口80。 TCP/IP是一个 协议族 ,包含一

    2024年02月05日
    浏览(42)
  • 12 正则表达式 | HTTP协议相关介绍

    在 Python 中需要通过正则表达式对字符串进行匹配的时候,可以使用一个模块,名字为 re。 示例: 输出的结果: 说明:re.match() 能够匹配出以== xxx 开头==的字符串 字符 功能 . 匹配任意 1 个字符(除了n) [ ] 匹配[ ]中列举的字符 d 匹配数字,即 0-9 dicimal D 匹配非数字,即不

    2024年02月12日
    浏览(29)
  • 【网络】HTTP协议详解

    😀大家好,我是 白晨 ,一个不是很能熬夜😫,但是也想日更的人✈。 如果喜欢这篇文章, 点个赞 👍, 关注一下 👀白晨吧!你的支持就是我最大的动力!💪💪💪 哟,大家好,我是白晨。距离上一次更新已经过了一段时间了,属实是当鸽子当惯了🤣。 上一篇文章我们

    2024年02月02日
    浏览(33)
  • HTTP 协议详解

    HTTP 协议全称为 Hypertext Transfer Protocol,即超文本传输协议,是互联网上应用最为广泛的一种网络传输协议。HTTP 协议定义了客户端(Browser)与服务器之间的通信规范,以实现对各种资源(如 HTML 页面、图像、音频、视频等)的传输和访问。本文将全面详细的描述 HTTP 协议的相

    2024年01月22日
    浏览(13)
  • HTTP/HTTPS协议详解

    目录  一. HTTP详解 ✅1.1 概念 ✅1.2 HTTP的协议格式 1.2.1 HTTP请求体格式: 1.2.2 HTTP响应体格式: ✅1.3 HTTP请求方法 ✅1.4 认识请求报头 ✅1.5 HTTP请求过程  ✅1.6 认识状态码 二. HTTPS详解 ✅2.1 HTTPS简介 ✅2.2 HTTPS加密过程 TCP/UDP是位于传输层的一种协议,而HTTP/HTTPS是位于应用层的

    2024年02月05日
    浏览(33)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包