既然有HTTP协议,为什么还要有RPC?

这篇具有很好参考价值的文章主要介绍了既然有HTTP协议,为什么还要有RPC?。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

既然有HTTP协议,为什么还要有RPC?

我想起了我刚工作的时候,第一次接触RPC协议,当时就很懵,我HTTP协议用得好好的,为什么还要用RPC协议?

 文章来源地址https://www.toymoban.com/news/detail-707982.html

于是就到网上去搜。

 

不少解释显得非常官方,我相信大家在各种平台上也都看到过,解释了又好像没解释,都在用一个我们不认识的概念去解释另外一个我们不认识的概念,懂的人不需要看,不懂的人看了还是不懂。

 

这种看了,又好像没看的感觉,云里雾里很难受,我懂

 

为了避免大家有强烈的审丑疲劳,今天我们来尝试重新换个方式讲一讲。

 

一、从TCP聊起

 

作为一个程序员,假设我们需要在A电脑的进程发一段数据到B电脑的进程,我们一般会在代码里使用socket进行编程。

 

这时候,我们可选项一般也就TCP和UDP二选一TCP可靠,UDP不可靠。除非是马总这种神级程序员(早期QQ大量使用UDP),否则,只要稍微对可靠性有些要求,普通人一般无脑选TCP就对了。

 

类似下面这样。

 

  •  
fd = socket(AF_INET,SOCK_STREAM,0);

 

其中SOCK_STREAM,是指使用字节流传输数据,说白了就是TCP协议

 

在定义了socket之后,我们就可以愉快地对这个socket进行操作,比如用bind()绑定IP端口,用connect()发起建连。

 

既然有HTTP协议,为什么还要有RPC?

握手建立连接流程

 

在连接建立之后,我们就可以使用send()发送数据,recv()接收数据。

 

光这样一个纯裸的TCP连接,就可以做到收发数据了,那是不是就够了?

 

不行,这么用会有问题。

 

二、使用纯裸TCP会有什么问题

 

八股文常背,TCP是有三个特点,面向连接、可靠、基于字节流

 

既然有HTTP协议,为什么还要有RPC?

TCP是什么

 

这三个特点真的概括得非常精辟,这个八股文我们没白背。

 

每个特点展开都能聊一篇文章,而今天我们需要关注的是基于字节流这一点。

 

字节流可以理解为一个双向的通道里流淌的数据,这个数据其实就是我们常说的二进制数据,简单来说就是一大堆 01 串。纯裸TCP收发的这些 01 串之间是没有任何边界的,你根本不知道到哪个地方才算一条完整消息。

 

既然有HTTP协议,为什么还要有RPC?

01二进制字节流

 

正因为这个没有任何边界的特点,所以当我们选择使用TCP发送"夏洛"和"特烦恼"的时候,接收端收到的就是"夏洛特烦恼",这时候接收端没法区分你是想要表达"夏洛"+"特烦恼"还是"夏洛特"+"烦恼"。

 

既然有HTTP协议,为什么还要有RPC?

消息对比

 

这就是所谓的粘包问题,之前也写过一篇专门的文章聊过这个问题。

 

说这个的目的是为了告诉大家,纯裸TCP是不能直接拿来用的,你需要在这个基础上加入一些自定义的规则,用于区分消息边界。

 

于是我们会把每条要发送的数据都包装一下,比如加入消息头,息头里写清楚一个完整的包长度是多少,根据这个长度可以继续接收数据,截取出来后它们就是我们真正要传输的消息体。

 

既然有HTTP协议,为什么还要有RPC?

消息边界长度标志

 

而这里头提到的消息头,还可以放各种东西,比如消息体是否被压缩过和消息体格式之类的,只要上下游都约定好了,互相都认就可以了,这就是所谓的协议

 

每个使用TCP的项目都可能会定义一套类似这样的协议解析标准,他们可能有区别,但原理都类似

 

于是基于TCP,就衍生了非常多的协议,比如HTTP和RPC。

 

三、HTTP和RPC

 

我们回过头来看网络的分层图。

 

既然有HTTP协议,为什么还要有RPC?

四层网络协议

 

TCP是传输层的协议,而基于TCP造出来的HTTP和各类RPC协议,它们都只是定义了不同消息格式的应用层协议而已。

 

HTTP协议(Hyper Text Transfer Protocol),又叫做超文本传输协议。我们用的比较多,平时上网在浏览器上敲个网址就能访问网页,这里用到的就是HTTP协议。

 

既然有HTTP协议,为什么还要有RPC?

HTTP调用

 

RPC(Remote Procedure Call),又叫做远程过程调用。它本身并不是一个具体的协议,而是一种调用方式

 

举个例子,我们平时调用一个本地方法就像下面这样。

 

  •  
 res = localFunc(req)

 

如果现在这不是个本地方法,而是个远端服务器暴露出来的一个方法remoteFunc,如果我们还能像调用本地方法那样去调用它,这样就可以屏蔽掉一些网络细节,用起来更方便,岂不美哉?

 

  •  
 res = remoteFunc(req)

 

既然有HTTP协议,为什么还要有RPC?

RPC可以像调用本地方法那样调用远端方法

 

基于这个思路,大佬们造出了非常多款式的RPC协议,比如比较有名的gRPC,thrift。

 

值得注意的是,虽然大部分RPC协议底层使用TCP,但实际上它们不一定非得使用TCP,改用UDP或者HTTP,其实也可以做到类似的功能。

 

既然有HTTP协议,为什么还要有RPC?

基于TCP协议的HTTP和RPC协议

 

到这里,我们回到文章标题的问题。

 

既然有HTTP协议,为什么还要有RPC?

 

其实,TCP是70年代出来的协议,而HTTP是90年代才开始流行的。而直接使用裸TCP会有问题,可想而知,这中间这么多年有多少自定义的协议,而这里面就有80年代出来的RPC。

 

所以我们该问的不是既然有HTTP协议为什么要有RPC,而是为什么有RPC还要有HTTP协议。

 

那既然有RPC了,为什么还要有HTTP呢?

 

现在电脑上装的各种联网软件,比如xx管家,xx卫士,它们都作为客户端(client)需要跟服务端(server)建立连接收发消息,此时都会用到应用层协议,在这种client/server (c/s)架构下,它们可以使用自家造的RPC协议,因为它只管连自己公司的服务器就ok了。

 

但有个软件不同,浏览器(browser),不管是chrome还是IE,它们不仅要能访问自家公司的服务器(server),还需要访问其他公司的网站服务器,因此它们需要有个统一的标准,不然大家没法交流。于是,HTTP就是那个时代用于统一 browser/server (b/s) 的协议。

 

也就是说在多年以前,HTTP主要用于b/s架构,而RPC更多用于c/s架构。但现在其实已经没分那么清了,b/s和c/s在慢慢融合。很多软件同时支持多端,比如某度云盘,既要支持网页版,还要支持手机端和pc端,如果通信协议都用HTTP的话,那服务器只用同一套就够了。而RPC就开始退居幕后,一般用于公司内部集群里,各个微服务之间的通讯。

 

那这么说的话,都用HTTP得了,还用什么RPC?

 

仿佛又回到了文章开头的样子,那这就要从它们之间的区别开始说起。

 

四、HTTP和RPC有什么区别

 

我们来看看RPC和HTTP区别比较明显的几个点。

 

1.服务发现

 

首先要向某个服务器发起请求,你得先建立连接,而建立连接的前提是,你得知道IP地址和端口。这个找到服务对应的IP端口的过程,其实就是服务发现

 

HTTP中,你知道服务的域名,就可以通过DNS服务去解析得到它背后的IP地址,默认80端口。

 

RPC的话,就有些区别,一般会有专门的中间服务去保存服务名和IP信息,比如consul或者etcd,甚至是redis。想要访问某个服务,就去这些中间服务去获得IP和端口信息。由于dns也是服务发现的一种,所以也有基于dns去做服务发现的组件,比如CoreDNS。

 

可以看出服务发现这一块,两者是有些区别,但不太能分高低。

 

2.底层连接形式

 

以主流的HTTP1.1协议为例,其默认在建立底层TCP连接之后会一直保持这个连接(keep alive),之后的请求和响应都会复用这条连接。

 

RPC协议,也跟HTTP类似,也是通过建立TCP长链接进行数据交互,但不同的地方在于,RPC协议一般还会再建个连接池,在请求量大的时候,建立多条连接放在池内,要发数据的时候就从池里取一条连接出来,用完放回去,下次再复用,可以说非常环保。

 

既然有HTTP协议,为什么还要有RPC?

connection_pool

 

由于连接池有利于提升网络请求性能,所以不少编程语言的网络库里都会给HTTP加个连接池,比如go就是这么干的。

 

可以看出这一块两者也没太大区别,所以也不是关键。

 

3.传输的内容

 

基于TCP传输的消息,说到底,无非都是消息头header和消息体body

 

header是用于标记一些特殊信息,其中最重要的是消息体长度。

 

body则是放我们真正需要传输的内容,而这些内容只能是二进制01串,毕竟计算机只认识这玩意。所以TCP传字符串和数字都问题不大,因为字符串可以转成编码再变成01串,而数字本身也能直接转为二进制。但结构体呢,我们得想个办法将它也转为二进制01串,这样的方案现在也有很多现成的,比如json,protobuf

 

这个将结构体转为二进制数组的过程就叫序列化,反过来将二进制数组复原成结构体的过程叫反序列化

 

既然有HTTP协议,为什么还要有RPC?

序列化和反序列化

 

对于主流的HTTP1.1,虽然它现在叫超文本协议,支持音频视频,但HTTP设计初是用于做网页文本展示的,所以它传的内容以字符串为主。header和body都是如此。在body这块,它使用json来序列化结构体数据。

 

我们可以随便截个图直观看下。

 

既然有HTTP协议,为什么还要有RPC?

HTTP报文

 

可以看到这里面的内容非常多的冗余,显得非常啰嗦。最明显的,像header里的那些信息,其实如果我们约定好头部的第几位是content-type,就不需要每次都真的把"content-type"这个字段都传过来,类似的情况其实在body的json结构里也特别明显。

 

而RPC,因为它定制化程度更高,可以采用体积更小的protobuf或其他序列化协议去保存结构体数据,同时也不需要像HTTP那样考虑各种浏览器行为,比如302重定向跳转啥的。因此性能也会更好一些,这也是在公司内部微服务中抛弃HTTP,选择使用RPC的最主要原因

 

既然有HTTP协议,为什么还要有RPC?

HTTP原理

 

既然有HTTP协议,为什么还要有RPC?

RPC原理

 

当然上面说的HTTP,其实特指的是现在主流使用的HTTP1.1,HTTP2在前者的基础上做了很多改进,所以性能可能比很多RPC协议还要好,甚至连gRPC底层都直接用的HTTP2。

 

那么问题又来了。

 

为什么既然有了HTTP2,还要有RPC协议?

 

这个是由于HTTP2是2015年出来的。那时候很多公司内部的RPC协议都已经跑了好些年了,基于历史原因,一般也没必要去换了。

 

总结

 

  • 纯裸TCP是能收发数据,但它是个无边界的数据流,上层需要定义消息格式用于定义消息边界。于是就有了各种协议,HTTP和各类RPC协议就是在TCP之上定义的应用层协议。

     

  • RPC本质上不算是协议,而是一种调用方式,而像gRPC和thrift这样的具体实现,才是协议,它们是实现了RPC调用的协议。目的是希望程序员能像调用本地方法那样去调用远端的服务方法。同时RPC有很多种实现方式,不一定非得基于TCP协议。

     

  • 从发展历史来说,HTTP主要用于b/s架构,而RPC更多用于c/s架构。但现在其实已经没分那么清了,b/s和c/s在慢慢融合。很多软件同时支持多端,所以对外一般用HTTP协议,而内部集群的微服务之间则采用RPC协议进行通讯。

     

  • RPC其实比HTTP出现得要早,且比目前主流的HTTP1.1性能要更好,所以大部分公司内部都还在使用RPC。

     

  • HTTP2.0在HTTP1.1的基础上做了优化,性能可能比很多RPC协议都要好,但由于是这几年才出来的,所以也不太可能取代掉RPC。

 

最后留个问题吧,大家有没有发现,不管是HTTP还是RPC,它们都有个特点,那就是消息都是客户端请求,服务端响应。客户端没问,服务端肯定就不答,这就有点僵了,但现实中肯定有需要下游主动发送消息给上游的场景,比如打个网页游戏,站在那啥也不操作,怪也会主动攻击我,这种情况该怎么办呢?

 

>>>>

参考资料

 

  • https://www.zhihu.com/question/41609070

 

作者丨小白

到了这里,关于既然有HTTP协议,为什么还要有RPC?的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 为什么要有虚拟内存?

    什么是虚拟内存? 多个进程如果同时操作真实的地址内存的话,会产生冲突。 于是操作系统就提供了一种机制,让每个进程都仿佛拥有全部的内存地址,这些内存地址是虚拟的,由操作系统提供统一的方式映射到真实的物理地址。 虚拟内存的作用: 进程隔离,进程层面不用

    2024年02月15日
    浏览(44)
  • SaaS是什么?企业为什么要有SaaS系统?

    什么是SaaS系统?企业为什么要有SaaS系统? 近几年, SaaS突然变成了一个热门词汇 ,无论是一些权威报告,还是 知乎上知友们热烈的讨论,对于Saas系统可谓是各有各的见解和看法。 今天就综合几位答主的观点,以及我个人的见解,为大家解释下,到底什么是SaaS系统。 想要

    2023年04月20日
    浏览(64)
  • I2C中为什么线与?为什么要有上拉电阻?

            首先,连接到 I2C 上的设备是开漏输出的。以漏极开漏输出(OD)为例,是指将输出级电路结构改为一个漏极开路输出的 MOS 管。这样做的好处在于: 防止短路。 可以实现 “线与”逻辑 ,可以减少一个与门的使用,简化电路。 结论: I2C支持多个主设备与多个从设

    2024年02月09日
    浏览(55)
  • 【UML】浅谈为什么要有UML?

    上高中的时候,经常使用一些软件,觉得这些软件挺有意思的,就一直很好奇系统这个东西是怎么构建出来的。直到后来,大学的时候上了一门叫做系统分析与设计的课程,从UML开始再到用Spring Boot和Vue写一个系统,慢慢的有一点点的概念,但是还是感觉迷迷糊糊。研究生的

    2024年02月05日
    浏览(58)
  • 有了MySQL,为什么还要有NoSQL

        🏆今日学习目标: 🍀MySQL和NoSQL的区别 ✅ 创作者 :林在闪闪发光 ⏰预计时间:30分钟 🎉个人主页:林在闪闪发光的个人主页  🍁林在闪闪发光的个人社区,欢迎你的加入: 林在闪闪发光的社区 目录 noSQL的大概意思 理论支撑 为什么需要NoSQL 为什么NoSQL有处理超大规模

    2023年04月20日
    浏览(76)
  • CentOS软件那么老为什么大家还要用它?

    作为一个专业的服务器系统,RHEL 系统理论上每一个软件包都有 RedHat 内部的人员负责维护,这个维护包括长期(和系统生命周期一样长)的开发、更新、测试、运维等。也就是说你能从 RHEL 系统源上获得的每一个软件包,出现问题都可以找 RedHat 负责。所以 RHEL 不可能无限制

    2024年02月01日
    浏览(53)
  • 为什么有了HTTP,还需要WebSocket协议?

    目录 WebSocket是什么? WebSocket怎样建立连接? WebSocket的实际用途 WebSocket 与 HTTP 的选择 HTTP 是基于 TCP协议 的,同一时间里,客户端和服务器只能有一方主动发数据,是 半双工通信 。 通常,打开某个网页,我们每点击一次网页上的某个选项,前端就会发送一次HTTP请求,网站

    2024年02月11日
    浏览(48)
  • 数据结构与算法这么难,为什么我们还要学习?

    提到数据结构与算法,就一定会伴随着诸多所谓的坚持和抱怨。同时,还有两个词总是出现,一个是内功,是对知识的定位,一个是吃透,是对自己

    2024年01月19日
    浏览(57)
  • 97-TCP为什么要有一个“TIME_WAIT“的状态

    \\\"TIME_WAIT\\\"状态存在的原因主要有两点: 假设上图中用于确认服务器结束报文段6的TCP报文段7丢失,那么服务器将重发结束报文段,因此客户端需要停留在某个状态以处理重复收到的结束报文段.否则客户端将以复位报文段来回应服务器,服务器则认为这是一个错误,因为他期望的是一

    2024年02月01日
    浏览(63)
  • HTTP协议演进:为什么说HTTP/1.1的时代已经过去了

    前言   欢迎来到今天的每日一题,每日一提。昨天聊到了,HTTP 是什么。有哪些组成部分。并且最后提到了 HTTP 的一些缺点,比如:性能较低,容易导致网络拥塞和延迟,不支持服务器推送等等。设计协议的大佬们,对这样的缺点肯定是不能容忍的,所以 HTTP2 它来了。 什

    2023年04月17日
    浏览(41)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包