Socket 是网络协议栈暴露给编程人员的 API,相比复杂的计算机网络协议,API 对关键操作和配置数据进行了抽象,简化了程序编程。
本文讲述的 socket 内容源自 Linux man。本文主要对各 API 进行详细介绍,从而更好的理解 socket 编程。
一.socket()
遵循 POSIX.1 - 2001、POSIX.1-2008、4.4BSD
1.库
标准 c 库,libc, -lc
2.头文件
<sys/socket.h>
3.接口定义
int socket(int domain, int type, int protocol);
4.接口描述
socket() 创建一个通信端点并返回一个指向该端点的文件描述符。返回的文件描述符号是当前进程没有打开的号最小的文件描述符。
5.参数
- domain
domain 参数指定了一个通信域,它选择了用于通信的协议家族,这些协议家族在<sys/socket.h> 中定义,当前 Linux 内核能够认识的格式包括:
名称 | 目的 |
AF_UNIX | 本地通信 |
AF_LOCAL | 和 AF_UNIX 同意 |
AF_INET | IPv4 网络协议 |
AF_AX25 | 业余无线电 AX.25 协议 |
AF_IPX | Novell 分组交换协议 |
AF_APPLETALK | Appletalk 协议 |
AF_X25 | X25 分组交换网络 |
AF_INET6 | IPv6 网络协议 |
AF_DECnet | DECnet 协议 socket |
AF_KEY | 密钥管理协议 |
AF_NETLINK | 内核用户接口设备 |
AF_PACKET | 底层 packet 接口 |
AF_RDS | 可靠的数据报套接字协议 |
AF_PPPOX | 通用 PPP 传输层,用于设置 L2 层隧道(L2TP、PPPoE) |
AF_LLC | 逻辑链路控制协议(IEEE 802.2 LLC) |
AF_IB | InfiniBand 本地访问 |
AF_MPLS | 多协议标记切换 |
AF_CAN | 控制器局域网汽车总线协议 |
AF_TIPC | 集群域内套接字 |
AF_BLUETOOTH | 蓝牙底层套接字协议 |
AF_ALG | 内核密码学 API 接口 |
AF_VSOCK | VSOCK 原来用于 VMWARE VSockets,hypervisor 和 guest 之间的通信协议 |
AF_KCM | 内核连接多路复用器接口 |
AF_XDP | 快速数据路径接口 |
更多关于地址家族的信息可以从 address_families(7) 中查看。
socket 有一个指定的 type 类型,定义了双方通信语义,目前定义的类型有:
SOCK_STREAM
提供有序、可靠、双向、面向连接的字节流,可以支持带歪数据传输机制。
SOCK_DGRAM
支持数据报文(无连接、不可靠定长消息)。
SOCK_SEQPACKET
提供了有序、可靠、双向、面向连接的数据传输,传输的内容不是字节流,而是固定长度的数据报文。数据报消费者每次通过 read 系统调用读取整个数据报文。
SOCK_RAW
提供原始网络协议访问。
SOCK_RDM
提供可靠的数据报层,但是并不保证有序。
SOCK_PACKET
已经过时了,新应用不应该使用,参考 packet(7)。
一些协议类型并不是被所有协议家族支持的。
Linux 2.6.27 后,type 类型具有另外一个目的:除了指定 socket 类型,还包含了下面数值的位或值,来控制 socket 的行为:
SOCK_NONBLOCK
在打开新文件描述符指向的文件时设置文件状态标记 O_NONBLOCK,这就不需要额外使用 fcntl() 来进行设置。
SOCK_CLOEXEC
设置新文件描述符的 FD_CLOEXEC 标记,可以参考 open() 来看为什么需要设置整个参数
protocol 指定了 socket 使用的具体协议,通常一个指定的协议家族、协议类型中只有一种协议,这时 protocol 可以指定为 0。然而,也可能存在多个协议,这种情况下就必须指定协议,而协议号是根据实际的通信域的不同而不同的。参考 protocol(5)。参考 getprotoent(3) 来查看如何将协议号映射到协议名字符串上。
SOCK_STREAM socket 是全双工字节流,它并没有保留记录边界。流套接字必须处于连接状态来进行数据的发送和接收。连接到其他套接字是通过 connect(2) 系统调用实现的。一旦连接上了,数据就可以通过 read(2) 和 write(2) 调用来进行传输,或者使用 send(2) 和 recv(2) 变体调用。会话结束后,应该使用 close(2) 来关闭。带外数据可以根据 send(2) 和 recv(2) 的描述来进行收发。
实现 SOCK_STREAM 的通信协议需要保证数据不能丢失或者重复。对于缓存到底层协议中在规定时间内无法传输完成的数据来讲,该连接会被视为死掉了。当套接字协议开启了 SO_KEEPALIVE 保活机制,协议会使用协议自己定义的方式来检查对端是否还活着。当我们在一个破损了的 pipe 上发送接收数据,那么就会收到 SIGPIPE信号,这会导致没有处理这个信号的本地进程直接退出。
SOCK_QEQPACKET 套接字使用同样的系统调用 SOCK_STREAM,唯一的不同 read(2) 调用返回指定请求数量的数据,接收数据包中剩余的数据将会被丢弃。同时,发过来的数据报文的所有边界都保留着。
SOCK_DGRAM 和 SOCK_RAW 套接字允许使用 sendto(2) 来发送数据报文给对端。数据报文通常使用 recvfrom(2) 来接收,这个接口会返回下一个数据报文以及发送者的地址。
SOCK_PACKET 是一个过时的直接从对端接收原始数据报文的套接字类型,应该使用 packet(7) 来替代。
我们可以使用 fcntl(2) 的 F_SETOWN 操作来指定进程或者进程组来接收带外数据到达信号 SIGURG 和连接异常中断信号 SIGPIPE。这个操作也可以用来接收 SIGIO 异步 I/O 通知事件。使用 F_SETOWN 等效于 ioctl() 调用的 FIOSETOWN 或者 SIOCSPGRP。
当网络给协议模块发送了错误指示信号时(比如 IP 层的 ICMP 消息),那么错误标记将会设置到套接字上,在套接字的下一次操作发生时,会将挂起的错误以错误码的形式返回。对于一些协议而言,也可以通过开启套接字特定的错误队列来获得关于错误的详细信息,可以参考 ip(7) 中的 IP_RECVERR。
对于套接字的操作是由套接字层面的选项来控制的,这些选项定义在 <sys/socket.h> 中。函数 setsockopt(2) 和 getsockopt(2) 用来设置和获取对于的选项。
带外数据传输指的是 TCP 在紧急情况下通过调整报文在发送/接收缓冲区的位置以及数据包中添加紧急标记的逻辑。
6.返回值
发生错误时返回 -1,设置 errno 指示错误码,否则返回一个新创建的整型文件描述符。
可能的错误码包括:
错误码 | 含义 |
EACCES | 没有权限创建对应的 socket |
EAFNOSUPPORT | 实现不支持指定的 AF_ 地址家族 |
EINVAL | 未知的协议或者地址家族不可用 |
EINVAL | type 参数不合法 |
EMFILE | 进程文件描述符到达最大限制 |
ENFILE | 系统文件描述符到达上限 |
ENOBUFS or ENOMEM | 内存不足 |
EPROTONOSUPPORT | domain 不支持指定的协议类型 |
二、bind
遵循 POSIX.1-2008
1.库
标准 c 库,libc, -lc
2.头文件
<sys/socket.h>
3.接口定义
int bind(int sockfd, const struct sockaddr *addr,
socklen_t addrlen);
4.接口描述
通过 socket() 接口创建 socket 后,socket 只存在于名字空间中,并没有实际的地址分配给它。bind 接口将 addr 指定的 IP 地址分配给由文件描述符 sockfd 指定的 socket。addrlen 指定了 addr 指针指向的地址结构的字节长度。以前我们将这个操作给 socket 分配名字。
通常在 TCP_STREAM socket 接收连接前需要将一个本地地址通过 bind 分配给 socket。
名字绑定规则随着地址家族的不同而不同。
addr 的数据结构也是随着地址家族的变化而变化的。sockaddr 结构的定义类似:
struct sockaddr {
sa_family_t sa_family;
char sa_data[14];
}
这个结构定义主要是为了防止编译器报错,主要是将各种地址结构做一个强制转换。
5. 返回值
发生错误时返回 -1,设置 errno 指示错误码,否则返回一个新创建的整型文件描述符。
可能的错误码包括:
错误码 | 含义 |
EACCES | 地址是保护地址,并且用户不是超级用户 |
EADDRINUSE | 指定的地址已经使用 |
EADDRINUSE | 对于 domain socket,端口号在地址结构体中 指定为 0,但在尝试 bind 到临时端口时,临时端口没有空闲的了 |
EBADF | sockfd 不是可用的文件描述符 |
EINVAL | socket 已经绑定到了一个地址 |
EINVAL | addrlen 错误,或者 addr 不是一个可用的 domain 地址 |
ENOTSOCK | 文件描述符没有指向任何 socket |
UNIX domain(AF_UNIX) 特定的错误码 | |
EACCESS | 在路径前缀下无搜索权限 |
EADDRNOTAVAIL | 请求的接口不存在或者不是本地的接口 |
EFAULT | addr 指向了用户无法访问的地址空间 |
ELOOP | 解析地址时遇到了太多的符号链接 |
ENAMETOOLONG | 地址太长 |
ENOENT | 指定路径不存在 |
ENOMEM | 内核内存不足 |
ENOTDIR | 路径前缀不是一个目录 |
EROFS | socket inode 位于只读文件系统中 |
6.示例代码
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/socket.h>
#include <sys/un.h>
#include <unistd.h>
#define MY_SOCK_PATH "/somepath"
#define LISTEN_BACKLOG 50
#define handle_error(msg) \
do { perror(msg); exit(EXIT_FAILURE); } while (0)
int
main(void)
{
int sfd, cfd;
socklen_t peer_addr_size;
struct sockaddr_un my_addr, peer_addr;
sfd = socket(AF_UNIX, SOCK_STREAM, 0);
if (sfd == -1)
handle_error("socket");
memset(&my_addr, 0, sizeof(my_addr));
my_addr.sun_family = AF_UNIX;
strncpy(my_addr.sun_path, MY_SOCK_PATH,
sizeof(my_addr.sun_path) - 1);
if (bind(sfd, (struct sockaddr *) &my_addr,
sizeof(my_addr)) == -1)
handle_error("bind");
if (listen(sfd, LISTEN_BACKLOG) == -1)
handle_error("listen");
/* Now we can accept incoming connections one
at a time using accept(2). */
peer_addr_size = sizeof(peer_addr);
cfd = accept(sfd, (struct sockaddr *) &peer_addr,
&peer_addr_size);
if (cfd == -1)
handle_error("accept");
/* Code to deal with incoming connection(s)... */
if (close(sfd) == -1)
handle_error("close");
if (unlink(MY_SOCK_PATH) == -1)
handle_error("unlink");
}
三、accept
1.库
标准 c 库,libc, -lc
2.头文件
<sys/socket.h>
3.接口定义
int accept(int sockfd, struct sockaddr *_Nullable restrict addr,
socklen_t *_Nullable restrict addrlen);
#define _GNU_SOURCE /* See feature_test_macros(7) */
#include <sys/socket.h>
int accept4(int sockfd, struct sockaddr *_Nullable restrict addr,
socklen_t *_Nullable restrict addrlen, int flags);
4.接口描述
accept 系统调用用于面向连接的 socket (SOCK_STREAM、SOCK_SEQPACKET),它会从监听的 socket(sockfd)的等待连接队列里拿到第一个连接请求,创建一个新的连接的 socket,并返回一个新的文件描述指向这个新的 socket。新创建的 socket 并没有处于监听状态,原来的 socket(sockfd)并不会受到任何影响。
sockfd 是由 sockect() 创建的,并通过 bind 绑定到了本地地址上,并通过 listen 监听连接。
addr 是一个指向 sockaddr 结构的指针,这个地址由对端 socket 的地址填充。而返回的 addr 的结构类型根据 socket 地址家族的不同而不同。当 addr 是 NULL 时,底层并不会对其填充,这种情况下 addrlen 也没有用,也应该是 NULL。
addrlen 参数是一个输入输出参数,调用者必须使用 addr 指向的结构体的大小来初始化它,而在返回时,则会使用对端地址的实际大小来填充。
如果提供的 buffer 太小,则返回的地址将会被截断,这种情况下,addrlen 会返回一个比提供值大的值。
如果当前等待连接队列中没有待连接请求,并且 socket 没有被设置成非阻塞,那么 accept() 将会一直阻塞。如果 socket 设置为非阻塞,那么 accept() 将报错为 EAGAIN 或者 EWOULDBLOCK。
为了获取 socket 上有连接请求过来,我们需要使用 select、poll、epoll。当一个新连接来临时,会产生一个可读事件,我们可以使用 accept 来继续从连接上获取一个 socket。
我们也可以设置 socket 上有连接时发送 SIGIO 信号。
如果 flag 是 0,那么 accept4() 就等同于 accept()。flag 可以是下面配置的或起来的值,来实现不同的行为:
- SOCK_NONBLOCK
设置新文件描述符的 O_NONBLOCK 属性
- SOCK_CLOEXEC
设置新文件描述符的 FD_CLEXEC 属性。
5.返回值
成功时,返回一个新接收的 socket 的文件描述符(非负值)。
出错时,返回 -1,设置 errno 为错误码,addrlen 不会被修改。
- 错误处理
Linux 的 accept() 会将既存的网络错误也会给返回值,这个行为和其他 BSD socket 实现的行为不太一样。为了可靠性,我们应该处理 accept 返回网络错误,这些错误是和协议相关的。比如 EAGAIN 表示重传,在TCP/IP 的场景下,还有 ENETDOWN、 EPROTO、 ENOPROTOOPT, EHOSTDOWN、 ENONET、 EHOSTUNREACH、 EOPNOTSUPP、 ENETUNREACH等需要处理。
可能的错误码包括:
错误码 | 含义 |
EAGAIN或EWOULDBLOCK | socket 设置为非阻塞,目前没有可用连接。POSIX.1-2001 和 POSIX.1-2008 允许范围任何一个错误,同时并没有他们有相同的值,所以为了实现移植性,需要分别判断。 |
ECONNABORTED | 连接已中断 |
EFAULT | addr 不是用户地址空间可写的地址 |
EBADF | sockfd 不是打开的文件描述符 |
EINVAL | socket 没有在监听连接或者addrlen不合法 |
EINVAL | accept4,flags 值不合法 |
ENOTSOCK | 文件描述符没有指向任何 socket |
EINTR | 在连接到达前,系统调用被信号打断 |
EMFILE | 进程描述符数达到上限 |
EFAULT | addr 指向了用户无法访问的地址空间 |
ENFILE | 系统文件描述符达到上限 |
ENAMETOOLONG | 地址太长 |
ENOENT | 指定路径不存在 |
ENOMEM或ENOBUFS | 内核内存不足 |
EOPNOTSUPP | socket 不 SOCK_STREAM 类型 |
EPERM | 防火墙禁止连接 |
EPROTO | 协议错误 |
Linux 上,新创建的 socket 并不会从监听 socket 上继承 O_NONBLOCK 和 O_AYSNC 属性,这点和 canonical BSD socket 实现的行为不同。所以,实现可移植的程序不应该依赖这些行为。
值得注意的是,有时在我们收到 SIGIO 或者通过select、poll、epoll 获得到一个刻度的事件时,并不一定就会有一个连接等待连接,这是因为连接很可能会被异步网络错误或者其他线程通过 accept() 拿走了。在这种情况下,就会导致 accept 阻塞,直到下一个连接到达。为了保证 accept 永远不会阻塞,传来的 socketfd 需要有 O_NONBLOCK 属性。
在最初的 BSD socket 实现中,accept 的第三个参数是 int *,在 POSIX.1g 草稿版标准想把它改成 size_t *C,后来 POSIX 标准和glibc 2.x 定为 socket_t *。
遵循:
accept() POSIX.1-2008
accept4 Linux 文章来源:https://www.toymoban.com/news/detail-698745.html
下一篇 【计算机网络】网络编程接口 Socket API 解读(2) 文章来源地址https://www.toymoban.com/news/detail-698745.html
到了这里,关于【计算机网络】网络编程接口 Socket API 解读(1)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!