Linux socket 通信和 select 以及 epoll 函数已关闭评论
87 次浏览

A+

摘要

　　将监听的套接字和本地IP和端口进行关联　　给监听的套接字设置监听，开始检测客户端链接

1.socket 通信

1.1 大小端转换

主机字节序 16 位值 <==> 网络字节序 16 位值
主机字节序 32 位值 <==> 网络字节序 32 位值

#include <arpa/inet.h>  // 主机字节序转换为网络字节序 uint16_t htons(uint16_t hostshort);    // host to net unsigned short 可用端口转换 unit32_t htonl(unit32_t hostlong);     // host to net unsigned int 可用ip地址转换  // 网络字节序转换为主机字节序 uint16_t ntohs(uint16_t netshort); unit32_t ntohl(unit32_t netlong);

1.2 IP地址转换

主机字节序的字符串IP地址 <==> 网络字节序的整形IP地址

#include <arpa/inet.h>  // 主机字节序IP to 网络字节序（大端）IP int inet_pton(int af, const char* src, void* dst); /*  参数:         af: 地址族协议 AF_INET(ipv4), AF_INET6(ipv6)         src: 主机字节序的字符串类型的IP地址，被转换的数据         dst: 传出参数, 存储转换之后的大端的IP地址     返回值: 成功0; 失败-1                */  const char *int_ntop(int af, const void *src, char *dst, socklen_t size); /*  参数:         af: 地址族协议 AF_INET; AF_INET6         src: 传入参数, 要被转换的数据指针, 指向内存中存储的大端IP地址（整形数）         dst: 传出参数, 指针指向主机字节序, 字符串类型的IP地址         size: dst指向的内存的大小     返回值:          成功: 返回指向 dst 指针指向的内存         失败: NULL                          */

1.3 套接字相关函数（按TCP介绍）

1.3.1 socket 创建

#include <arpa/inet.h>  // 该头文件包括了 <sys/socket.h>  int socket(int domain, int type, int protocol); /* 参数:         domain: AF_INET; AF_INET6         type:             SOCK_STREAM: 流式传输协议             SOCK_DGRAM: 报式传输协议         protocol: 默认写0             流式传输默认 TCP             报式传输默认 UDP     返回值:         成功: 返回文件描述符         失败: 返回-1                      */

1.3.2 bind 绑定套接字

　　将监听的套接字和本地IP和端口进行关联

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen); /*  参数:         sockfd: 用于监听的套接字, 通过socket创建         addr: 将本地ip和端口初始化给该结构体（需要用大端）             绑定的时候服务器一般ip使用宏 INADDR_ANY (0)             0 表示绑定该主机的所有ip地址, 多个网卡可能有多个ip         addrlen: 记录第二个指针指向内存的大小, sizeof(struct sockaddr)     返回值:         成功0, 失败-1                       */

1.3.3 listen 监听套接字

　　给监听的套接字设置监听，开始检测客户端链接

int listen(int sockfd, int backlog); /*  参数:         sockfd: 监听的套接字, 设置监听前需要先绑定         backlog: 可以同时检测的新的连接个数, 最大值128     返回值:         成功0, 失败-1                */

1.3.4 accept 接收客户端连接

　　等待并接受客户端的连接，阻塞函数，没有客户端连接就阻塞，监听的文件描述符缓冲区没有数据就阻塞，有数据就解除阻塞建立连接，连接建立成功后，返回一个通信用的文件描述符

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen); /*  参数:         sockfd: 监听的文件描述符         addr: 传出参数, 保存了建立连接的客户端的地址信息(ip 端口) -> 大端存储             不需要客户端信息则填NULL         addrlen: 传入传出参数, 传入addr指针指向的内存大小, 传出存储了客户端信息的addr内存大小             addr为NULL，则该参数也填NULL                         返回值:         文件描述符或-1                           */

1.3.5 read、recv 读数据

　　读取数据，如果数据区空会读堵塞

ssize_t read(int sockfd, void *buf, size_t size); ssize_t recv(int sockfd, void *buf, size_t size, int flags); /*  参数:         sockfd: 通信文件描述符             服务器端: accept 返回值             客户端: socket 创建得到, connect 初始化连接         buf: 存储接收到的数据, 数据来自文件描述符对应的缓冲区         size: buf 的内存容量         flag: 默认属性0即可     返回值:         >0: 读到的字节数         =0: 对方断开连接         -1: 读异常, 失败                      */

1.3.6 write、send 写数据

　　发送数据，如果数据区满会写阻塞

ssize_t write(int fd, const void *buf, size_t len); ssize_t send(int fd, const void *buf, size_t len, int flags); /*  参数:         fd: 通信的文件描述符         buf: 要发送的数据缓冲区         len: 缓冲区大小         flags: 使用默认属性0即可             */

1.3.7 connect 客户端连接

　　客户端连接服务器

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen); /*  参数:         sockfd: 通信文件描述符         addr: 连接服务器的ip和端口信息（需要使用大端描述）         addrlen: 参数addr指向的内存大小     返回值:         成功0; 失败-1                   */

1.4 套接字函数介绍（按UDP介绍）

1.5 套接字选项

　　该函数用来设置套接字选项，端口复用、广播、组播等，下面是端口复用的参数解释

int setsockopt(int sockfd, int level, int optname, const void *optval, socklen_t optlen); /*  参数         sockfd: 监听的套接字         level: SOL_SOCKET         optname: SO_REUSEPORT         optval: 实际类型int             0 -> 端口不复用             1 -> 端口复用         optlen: optval 指针指向的内存大小 sizeof(int)     返回值         成功0, 失败-1                        */

2. IO多路复用

2.1 select

构造一个文件描述符列表，将要监听的文件描述符添加到该列表中（最大支持1024，线性描述）

调用一个函数，监听该表中的文件描述符，知道这些描述符中的一个进行IO操作时，函数返回（该函数为阻塞函数，检测由内核完成）

读集合：检测文件描述符列表的读缓冲区
- 监听的文件描述符：新客户端连接
- 通信的文件描述符：新数据到达

- 写集合：内核检测集合中文件描述符是否可写
  - 通信的文件描述符
- 异常集合：检测文件描述符是否有异常
返回时，告诉进程有哪些描述符需要进行IO操作

#include <sys/select.h> int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout); /*  参数:         nfds: 下面三个集合中, 最大文件描述符值 + 1         readfds: 传出传出参数，读集合，检测若干文件描述符的读缓冲区（新连接 / 新数据）         writefds: 传入传出参数，写集合，检测若干文件描述符的写缓冲区（一般都可写，很少用）         execptfds: 传入传出参数，异常集合         timeout: 表示时间段，最长检测多长时间，超过这个时间还在阻塞就解除阻塞             NULL 一直阻塞等待； 0 函数调用后立刻返回     返回值:         >0: 检测完成后，满足条件的总个数         =0: 超时强制返回         - 1: 失败                                            */

　　timeval 结构体

struct timeval {     time_t         tv-sec;     suseconds_t    tv_usec; };

　　fd_set 文件描述符集合（位操作）操作函数

void FD_CLR(int fd, fd_set *set);     // 删除fd int FD_ISSET(int fd, fd_set *set);    // 判断fd是否在集合 void FD_SET(int fd, fd_set *set);     // 添加fd void FD_ZERO(fd_set *set);            // 清空fd（初始化）

2.2 epoll

　　在select/poll时代，服务器进程每次都把这100万个连接告诉操作系统(从用户态复制句柄数据结构到内核态)，让操作系统内核去查询这些套接字上是否有事件发生，轮询完后，再将句柄数据复制到用户态，让服务器应用程序轮询处理已发生的网络事件，这一过程资源消耗较大，因此，select/poll一般只能处理几千的并发连接。

epoll的设计和实现与select完全不同。epoll通过在Linux内核中申请一个简易的文件系统。把原先的select/poll调用分成了3个部分：

1）调用epoll_create()建立一个epoll对象(在epoll文件系统中为这个句柄对象分配资源)

2）调用epoll_ctl向epoll对象中添加这100万个连接的套接字

3）调用epoll_wait收集发生的事件的连接

如此一来，要实现上面说是的场景，只需要在进程启动时建立一个epoll对象，然后在需要的时候向这个epoll对象中添加或者删除连接。同时，epoll_wait的效率也非常高，因为调用epoll_wait时，并没有一股脑的向操作系统复制这100万个连接的句柄数据，内核也不需要去遍历全部的连接。

2.2.1 epoll_create 创建 epoll

#include <sys/epoll.h> int epoll_create(int size); /*  参数:         size: 没有实际意义, 大于0即可     返回值:         成功: 返回一个文件描述符                 该文件描述符对应的指针存储了红黑树的根节点         失败: -1                             */

2.2.2 epoll_ctl 操作epoll

　　实现对 epoll 树上节点的操作（添加、修改、删除节点）

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); /* 参数:         epfd: epoll_create() 函数的返回值，找到对应的epoll实例         op:              EPOLL_CTL_ADD: 添加新节点             EPOLL_CTL_MOD: 修改已经添加到树上节点的属性（读改写）             EPOLL_CTL_DEL: 删除节点         fd: 要操作的文件描述符             添加 / 修改 / 删除（监听、通信）         event: 对应的事件（若删除填NULL）             EPOLLIN: 读事件             EPOLLOUT: 写事件                     */

epoll_data

typedef union epoll_data{     void      *ptr;     int        fd;         // 该联合体常用这个     uint32_t   u32;     uint64_t   u64; } epoll_data_t;

epoll_event
- event 是位操作，EPOLLIN 检测写缓冲区，EPOLLOUT 检测读缓冲区
- data.fd 等于 epoll_ctl 函数调用的第三个参数

struct epoll_event{     uint32_t    event;    // Epoll events;     epoll_data_t data;    // User data variable };

2.2.3 epoll_wait

　　阻塞函数，委托内核检测epoll树上文件描述符的状态，如果没有状态变化，默认一直阻塞

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout); /*  参数:         epfd: epoll_create() 的返回值, 找到epoll实例         event: 传出参数，记录了这轮检测到epoll模型中有状态变化的文件描述符（结构体数组地址）         maxevent: events数组的容量         timeout: 超时时长 ms（-1一直阻塞; 0立即返回）     返回值:         成功: 有多少文件描述符发生变化                        */

2.2.4 Level triggered 水平模式（默认）

　　LT（level triggered）是缺省的工作方式，同时支持 block 和 no-block socket。这种模式下，内核会通知文件描述符是否就绪，如果不进行任何操作，内核会一直通知你该文件描述符就绪

2.2.5 Edge triggered 边沿模式

　　ET（edge triggered）是高速工作模式，只支持 no-block socket。这种模式下，如果接到通知，但是没有把数据从缓冲区读完，epoll_wait不会再次通知；直到再次接收到新数据也一样通知一次，但是此时他会接着上次的缓冲区数据读。

    struct epoll_event ev;     ev.events = EPOLLIN | EPOLLET;  // 设置文件描述符为边沿模式     ev.data.fd = lfd;

　　使用边沿模式读数据需要在收到消息后我们一般需要 while(1) 死循环读取数据直到缓冲区数据读完，所以需要设置文件描述符为非阻塞状态，让read可以非阻塞读取数据，通过 read 的返回值判断是否结束该死循环

int fcntl(int fd, int cmd, ...);  int flag = fcntl(cfd, F_GETFL); flag = flag | O_NONBLOCK; fcntl(cfd, F_SETFL, flag);    //设置文件描述符为非阻塞, read函数再读取不会阻塞

　　最后因为这里已经设置为非阻塞，可以根据read的返回值判断是否已经读完缓冲区了，如果读完了会有errno EAGAIN的错误码，根据该错误码跳出循环即可

while(1) {     int len = recv(curfd, buf, sizeof(buf), 0);     if(len > 0)         printf("打印接收的数据");     else if( len == 0)         printf("断开连接");     else     {         if(errno==EAGAIN)         {             printf("数据读完了");             break; // 跳出循环         }         perror("接收错误");         exit(0);     } }

2.2.4 服务器代码示例

#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <arpa/inet.h> #include <sys/epoll.h>  int main() {     // 1. 创建套接字     int lfd = socket(AF_INET, SOCK_STREAM, 0);     if(lfd == -1)     {         perror("socket error");         exit(1);     }      // 2.将 套接字 和 ip端口 绑定     struct sockaddr_in addr;     addr.sin_family = AF_INET;  // ipv4     addr.sin_addr.s_addr= INADDR_ANY;   // 0地址（本地任意地址）     addr.sin_port = htons(8989);    // 端口转为大端     int ret = bind(lfd, (struct sockaddr*)&addr, sizeof(addr));     if(ret == -1)     {         perror("bind error");         exit(2);     }      // 3.设置监听     ret = listen(lfd, 128);     if(ret == -1)     {         perror("listen error");         exit(3);     }      // 4.初始化检测的集合     int epfd = epoll_create(1);     if(epfd == -1)     {         perror("epoll_create error");         exit(4);     }      // 5.将要检测的节点添加到epoll树中     struct epoll_event ev;     ev.events = EPOLLIN;     ev.data.fd = lfd;     ret = epoll_ctl(epfd, EPOLL_CTL_ADD, lfd, &ev);     if(ret == -1)     {         perror("epoll_ctl");         exit(5);     }      // 6.委托内核检测epoll树中的文件描述符状态     struct epoll_event evs[1024];     int size = sizeof(evs) / sizeof(evs[0]);     while(1)     {         int num = epoll_wait(epfd, evs, size, -1);  // 把文件描述符发生变化的储存到 evs 数组中         printf("num = %dn", num);         // 遍历evs数组         for(int i=0; i<num; i++)         {             int curfd = evs[i].data.fd;             if(curfd == lfd)    // lfd 套接字状态改变说明有新链接请求             {                 int cfd = accept(lfd, NULL, NULL);                 ev.events = EPOLLIN;                 ev.data.fd = cfd;                 epoll_ctl(epfd, EPOLL_CTL_ADD, cfd, &ev);   // 把新的链接加入到epoll树中             }             else    // 其他套接字状态改变说明有新数据抵达             {                 char buf[1024];                 memset(buf, 0, sizeof(buf));                 int len = recv(curfd, buf, sizeof(buf), 0);                 if(len == 0)                 {                     printf("客户端断开了链接...n");                     epoll_ctl(epfd, EPOLL_CTL_DEL, curfd, NULL);                     close(curfd);                 }                 else if(len>0)                 {                     printf("recv data: %sn");                     send(curfd, buf, len, 0);                 }                 else                 {                     perror("recv error");                     exit(6);                 }             }         }     } }

便宜好用的国外VPS推荐