Linux socket 通信和 select 以及 epoll 函数

  • Linux socket 通信和 select 以及 epoll 函数已关闭评论
  • 87 次浏览
  • A+
所属分类:linux技术
摘要

  将监听的套接字和本地IP和端口进行关联  给监听的套接字设置监听,开始检测客户端链接


1.socket 通信

1.1 大小端转换

  • 主机字节序 16 位值 <==> 网络字节序 16 位值
  • 主机字节序 32 位值 <==> 网络字节序 32 位值
#include <arpa/inet.h>  // 主机字节序转换为网络字节序 uint16_t htons(uint16_t hostshort);    // host to net unsigned short 可用端口转换 unit32_t htonl(unit32_t hostlong);     // host to net unsigned int 可用ip地址转换  // 网络字节序转换为主机字节序 uint16_t ntohs(uint16_t netshort); unit32_t ntohl(unit32_t netlong);

1.2 IP地址转换

  • 主机字节序的字符串IP地址  <==> 网络字节序的整形IP地址
#include <arpa/inet.h>  // 主机字节序IP to 网络字节序(大端)IP int inet_pton(int af, const char* src, void* dst); /*  参数:         af: 地址族协议 AF_INET(ipv4), AF_INET6(ipv6)         src: 主机字节序的字符串类型的IP地址,被转换的数据         dst: 传出参数, 存储转换之后的大端的IP地址     返回值: 成功0; 失败-1                */  const char *int_ntop(int af, const void *src, char *dst, socklen_t size); /*  参数:         af: 地址族协议 AF_INET; AF_INET6         src: 传入参数, 要被转换的数据指针, 指向内存中存储的大端IP地址(整形数)         dst: 传出参数, 指针指向主机字节序, 字符串类型的IP地址         size: dst指向的内存的大小     返回值:          成功: 返回指向 dst 指针指向的内存         失败: NULL                          */

1.3 套接字相关函数(按TCP介绍)

1.3.1 socket 创建

#include <arpa/inet.h>  // 该头文件包括了 <sys/socket.h>  int socket(int domain, int type, int protocol); /* 参数:         domain: AF_INET; AF_INET6         type:             SOCK_STREAM: 流式传输协议             SOCK_DGRAM: 报式传输协议         protocol: 默认写0             流式传输默认 TCP             报式传输默认 UDP     返回值:         成功: 返回文件描述符         失败: 返回-1                      */

1.3.2 bind 绑定套接字

  将监听的套接字和本地IP和端口进行关联

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen); /*  参数:         sockfd: 用于监听的套接字, 通过socket创建         addr: 将本地ip和端口初始化给该结构体(需要用大端)             绑定的时候服务器一般ip使用宏 INADDR_ANY (0)             0 表示绑定该主机的所有ip地址, 多个网卡可能有多个ip         addrlen: 记录第二个指针指向内存的大小, sizeof(struct sockaddr)     返回值:         成功0, 失败-1                       */

1.3.3 listen 监听套接字

  给监听的套接字设置监听,开始检测客户端链接

int listen(int sockfd, int backlog); /*  参数:         sockfd: 监听的套接字, 设置监听前需要先绑定         backlog: 可以同时检测的新的连接个数, 最大值128     返回值:         成功0, 失败-1                */

1.3.4 accept 接收客户端连接

  等待并接受客户端的连接,阻塞函数,没有客户端连接就阻塞,监听的文件描述符缓冲区没有数据就阻塞,有数据就解除阻塞建立连接,连接建立成功后,返回一个通信用的文件描述符

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen); /*  参数:         sockfd: 监听的文件描述符         addr: 传出参数, 保存了建立连接的客户端的地址信息(ip 端口) -> 大端存储             不需要客户端信息则填NULL         addrlen: 传入传出参数, 传入addr指针指向的内存大小, 传出存储了客户端信息的addr内存大小             addr为NULL,则该参数也填NULL                         返回值:         文件描述符或-1                           */

1.3.5 read、recv 读数据

  读取数据,如果数据区空会读堵塞

ssize_t read(int sockfd, void *buf, size_t size); ssize_t recv(int sockfd, void *buf, size_t size, int flags); /*  参数:         sockfd: 通信文件描述符             服务器端: accept 返回值             客户端: socket 创建得到, connect 初始化连接         buf: 存储接收到的数据, 数据来自文件描述符对应的缓冲区         size: buf 的内存容量         flag: 默认属性0即可     返回值:         >0: 读到的字节数         =0: 对方断开连接         -1: 读异常, 失败                      */

1.3.6 write、send 写数据

  发送数据,如果数据区满会写阻塞

ssize_t write(int fd, const void *buf, size_t len); ssize_t send(int fd, const void *buf, size_t len, int flags); /*  参数:         fd: 通信的文件描述符         buf: 要发送的数据缓冲区         len: 缓冲区大小         flags: 使用默认属性0即可             */

1.3.7 connect 客户端连接

  客户端连接服务器

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen); /*  参数:         sockfd: 通信文件描述符         addr: 连接服务器的ip和端口信息(需要使用大端描述)         addrlen: 参数addr指向的内存大小     返回值:         成功0; 失败-1                   */

1.4 套接字函数介绍(按UDP介绍)

 

1.5 套接字选项

  该函数用来设置套接字选项,端口复用、广播、组播等,下面是端口复用的参数解释

int setsockopt(int sockfd, int level, int optname, const void *optval, socklen_t optlen); /*  参数         sockfd: 监听的套接字         level: SOL_SOCKET         optname: SO_REUSEPORT         optval: 实际类型int             0 -> 端口不复用             1 -> 端口复用         optlen: optval 指针指向的内存大小 sizeof(int)     返回值         成功0, 失败-1                        */

2. IO多路复用

2.1 select

  • 构造一个文件描述符列表,将要监听的文件描述符添加到该列表中(最大支持1024,线性描述)
  • 调用一个函数,监听该表中的文件描述符,知道这些描述符中的一个进行IO操作时,函数返回(该函数为阻塞函数,检测由内核完成)

    • 读集合:检测文件描述符列表的读缓冲区
      • 监听的文件描述符:新客户端连接
      • 通信的文件描述符:新数据到达
    • 写集合:内核检测集合中文件描述符是否可写
      • 通信的文件描述符
    • 异常集合:检测文件描述符是否有异常
  • 返回时,告诉进程有哪些描述符需要进行IO操作
#include <sys/select.h> int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout); /*  参数:         nfds: 下面三个集合中, 最大文件描述符值 + 1         readfds: 传出传出参数,读集合,检测若干文件描述符的读缓冲区(新连接 / 新数据)         writefds: 传入传出参数,写集合,检测若干文件描述符的写缓冲区(一般都可写,很少用)         execptfds: 传入传出参数,异常集合         timeout: 表示时间段,最长检测多长时间,超过这个时间还在阻塞就解除阻塞             NULL 一直阻塞等待; 0 函数调用后立刻返回     返回值:         >0: 检测完成后,满足条件的总个数         =0: 超时强制返回         - 1: 失败                                            */

  timeval 结构体

struct timeval {     time_t         tv-sec;     suseconds_t    tv_usec; };

  fd_set 文件描述符集合(位操作)操作函数

void FD_CLR(int fd, fd_set *set);     // 删除fd int FD_ISSET(int fd, fd_set *set);    // 判断fd是否在集合 void FD_SET(int fd, fd_set *set);     // 添加fd void FD_ZERO(fd_set *set);            // 清空fd(初始化)

2.2 epoll

  在select/poll时代,服务器进程每次都把这100万个连接告诉操作系统(从用户态复制句柄数据结构到内核态),让操作系统内核去查询这些套接字上是否有事件发生,轮询完后,再将句柄数据复制到用户态,让服务器应用程序轮询处理已发生的网络事件,这一过程资源消耗较大,因此,select/poll一般只能处理几千的并发连接。

epoll的设计和实现与select完全不同。epoll通过在Linux内核中申请一个简易的文件系统。把原先的select/poll调用分成了3个部分:

1)调用epoll_create()建立一个epoll对象(在epoll文件系统中为这个句柄对象分配资源)

2)调用epoll_ctl向epoll对象中添加这100万个连接的套接字

3)调用epoll_wait收集发生的事件的连接

如此一来,要实现上面说是的场景,只需要在进程启动时建立一个epoll对象,然后在需要的时候向这个epoll对象中添加或者删除连接。同时,epoll_wait的效率也非常高,因为调用epoll_wait时,并没有一股脑的向操作系统复制这100万个连接的句柄数据,内核也不需要去遍历全部的连接。

2.2.1 epoll_create 创建 epoll

#include <sys/epoll.h> int epoll_create(int size); /*  参数:         size: 没有实际意义, 大于0即可     返回值:         成功: 返回一个文件描述符                 该文件描述符对应的指针存储了红黑树的根节点         失败: -1                             */

2.2.2 epoll_ctl 操作epoll

  实现对 epoll 树上节点的操作(添加、修改、删除节点)

int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); /* 参数:         epfd: epoll_create() 函数的返回值,找到对应的epoll实例         op:              EPOLL_CTL_ADD: 添加新节点             EPOLL_CTL_MOD: 修改已经添加到树上节点的属性(读改写)             EPOLL_CTL_DEL: 删除节点         fd: 要操作的文件描述符             添加 / 修改 / 删除(监听、通信)         event: 对应的事件(若删除填NULL)             EPOLLIN: 读事件             EPOLLOUT: 写事件                     */

  • epoll_data
typedef union epoll_data{     void      *ptr;     int        fd;         // 该联合体常用这个     uint32_t   u32;     uint64_t   u64; } epoll_data_t;

  • epoll_event
    • event 是位操作,EPOLLIN 检测写缓冲区,EPOLLOUT 检测读缓冲区
    • data.fd 等于 epoll_ctl 函数调用的第三个参数
struct epoll_event{     uint32_t    event;    // Epoll events;     epoll_data_t data;    // User data variable };

2.2.3 epoll_wait

  阻塞函数,委托内核检测epoll树上文件描述符的状态,如果没有状态变化,默认一直阻塞

int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout); /*  参数:         epfd: epoll_create() 的返回值, 找到epoll实例         event: 传出参数,记录了这轮检测到epoll模型中有状态变化的文件描述符(结构体数组地址)         maxevent: events数组的容量         timeout: 超时时长 ms(-1一直阻塞; 0立即返回)     返回值:         成功: 有多少文件描述符发生变化                        */

2.2.4 Level triggered 水平模式(默认)

  LT(level triggered)是缺省的工作方式,同时支持 block 和 no-block socket。这种模式下,内核会通知文件描述符是否就绪,如果不进行任何操作,内核会一直通知你该文件描述符就绪

2.2.5 Edge triggered 边沿模式

  ET(edge triggered)是高速工作模式,只支持 no-block socket。这种模式下,如果接到通知,但是没有把数据从缓冲区读完,epoll_wait不会再次通知;直到再次接收到新数据也一样通知一次,但是此时他会接着上次的缓冲区数据读。

    struct epoll_event ev;     ev.events = EPOLLIN | EPOLLET;  // 设置文件描述符为边沿模式     ev.data.fd = lfd;

  使用边沿模式读数据需要在收到消息后我们一般需要 while(1) 死循环读取数据直到缓冲区数据读完,所以需要设置文件描述符为非阻塞状态,让read可以非阻塞读取数据,通过 read 的返回值判断是否结束该死循环

int fcntl(int fd, int cmd, ...);  int flag = fcntl(cfd, F_GETFL); flag = flag | O_NONBLOCK; fcntl(cfd, F_SETFL, flag);    //设置文件描述符为非阻塞, read函数再读取不会阻塞

  最后因为这里已经设置为非阻塞,可以根据read的返回值判断是否已经读完缓冲区了,如果读完了会有errno EAGAIN的错误码,根据该错误码跳出循环即可

while(1) {     int len = recv(curfd, buf, sizeof(buf), 0);     if(len > 0)         printf("打印接收的数据");     else if( len == 0)         printf("断开连接");     else     {         if(errno==EAGAIN)         {             printf("数据读完了");             break; // 跳出循环         }         perror("接收错误");         exit(0);     } }

2.2.4 服务器代码示例

#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <arpa/inet.h> #include <sys/epoll.h>  int main() {     // 1. 创建套接字     int lfd = socket(AF_INET, SOCK_STREAM, 0);     if(lfd == -1)     {         perror("socket error");         exit(1);     }      // 2.将 套接字 和 ip端口 绑定     struct sockaddr_in addr;     addr.sin_family = AF_INET;  // ipv4     addr.sin_addr.s_addr= INADDR_ANY;   // 0地址(本地任意地址)     addr.sin_port = htons(8989);    // 端口转为大端     int ret = bind(lfd, (struct sockaddr*)&addr, sizeof(addr));     if(ret == -1)     {         perror("bind error");         exit(2);     }      // 3.设置监听     ret = listen(lfd, 128);     if(ret == -1)     {         perror("listen error");         exit(3);     }      // 4.初始化检测的集合     int epfd = epoll_create(1);     if(epfd == -1)     {         perror("epoll_create error");         exit(4);     }      // 5.将要检测的节点添加到epoll树中     struct epoll_event ev;     ev.events = EPOLLIN;     ev.data.fd = lfd;     ret = epoll_ctl(epfd, EPOLL_CTL_ADD, lfd, &ev);     if(ret == -1)     {         perror("epoll_ctl");         exit(5);     }      // 6.委托内核检测epoll树中的文件描述符状态     struct epoll_event evs[1024];     int size = sizeof(evs) / sizeof(evs[0]);     while(1)     {         int num = epoll_wait(epfd, evs, size, -1);  // 把文件描述符发生变化的储存到 evs 数组中         printf("num = %dn", num);         // 遍历evs数组         for(int i=0; i<num; i++)         {             int curfd = evs[i].data.fd;             if(curfd == lfd)    // lfd 套接字状态改变说明有新链接请求             {                 int cfd = accept(lfd, NULL, NULL);                 ev.events = EPOLLIN;                 ev.data.fd = cfd;                 epoll_ctl(epfd, EPOLL_CTL_ADD, cfd, &ev);   // 把新的链接加入到epoll树中             }             else    // 其他套接字状态改变说明有新数据抵达             {                 char buf[1024];                 memset(buf, 0, sizeof(buf));                 int len = recv(curfd, buf, sizeof(buf), 0);                 if(len == 0)                 {                     printf("客户端断开了链接...n");                     epoll_ctl(epfd, EPOLL_CTL_DEL, curfd, NULL);                     close(curfd);                 }                 else if(len>0)                 {                     printf("recv data: %sn");                     send(curfd, buf, len, 0);                 }                 else                 {                     perror("recv error");                     exit(6);                 }             }         }     } }