Loading...
墨滴

高性能架构探索

2021/08/27  阅读:37  主题:默认主题

从示例代码分析整个tcp的生存周期

在前几篇文章中,我们先从宏观角度(TCP 概述)大致介绍了 tcp 的概念,然后从微观角度(滑动窗口、拥塞窗口等)详细说明了从 client 端和 server 端,tcp 是如何进行网络控制的。在本文中,我们将通过一个 tcp 例子,将整个过程联通起来,讲解 tcp 从连接、发送以及关闭,整个流程是怎样运行的。

示例代码

server.c

#include <unistd.h>
#include <stdio.h>
#include <sys/socket.h>
#include <stdlib.h>
#include <netinet/in.h>
#include <string.h>

int main(int argc, char **) {
    int server_fd, new_socket, valread;
    struct sockaddr_in address;
    int opt = 1;
    int addrlen = sizeof(address);
    char buffer[1024] = {0};
    char *hello = "Hello from server";
    int port = 8080;

    // 创建socket文件描述符
    if ((server_fd = socket(AF_INET, SOCK_STREAM, 0)) == 0) {
        return 1;
    }


     // 端口 & 地址复用
    if (setsockopt(server_fd, SOL_SOCKET, SO_REUSEADDR | SO_REUSEPORT,
                                                  &opt, sizeof(opt))) {
        return 1;
    }
    address.sin_family = AF_INET;
    address.sin_addr.s_addr = INADDR_ANY;
    address.sin_port = htons( port );

    // 绑定8080端口
    if (bind(server_fd, (struct sockaddr *)&address,
                                 sizeof(address))<0) {
        perror("bind failed");
        return 1;
    }
    if (listen(server_fd, 3) < 0) {
        return 1;
    }
    if ((new_socket = accept(server_fd, (struct sockaddr *)&address,
                       (socklen_t*)&addrlen))<0) {
        return 1;
    }
    valread = read( new_socket , buffer, 1024);
    // 向client发送消息
    send(new_socket , hello , strlen(hello) , 0 );
    close(new_socket);
    close(server_fd);
    return 0;
}

client.c

#include <stdio.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>

int main(int argc, char const *argv[]) {
    int sock = 0, valread;
    struct sockaddr_in serv_addr;
    char *hello = "Hello from client";
    char buffer[1024] = {0};
    int port = 8080;
    if ((sock = socket(AF_INET, SOCK_STREAM, 0)) < 0) {        return -1;
    }

    serv_addr.sin_family = AF_INET;
    serv_addr.sin_port = htons(port);

    if(inet_pton(AF_INET, "127.0.0.1", &serv_addr.sin_addr)<=0) {
        return 1;
    }

    // 建立连接
    if (connect(sock, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) < 0) {
        return 1;
    }
    send(sock , hello , strlen(hello) , 0 );
    valread = read( sock , buffer, 1024);
    close(sock);
    return 0;
}

上面是 tcp 的示例代码,很简单,算是网络编程的入门级代码。读者可以使用下面命令进行编译:

gcc -g server.c -o server
gcc -g client.c -o client

过程分析

下面,我们分析前面的示例代码, 对于 server 端:

1、创建 socket

2、bind 端口

3、listen

4、accept 新的连接,获取新连接的 socket

5、通过 read 函数,接收数据

6、通过 send 函数,发送数据

7、调用 close 函数关闭 socket

对于 client 端:

1、创建 socket

2、通过 connect 与 server 端建立连接

3、通过 send 发送数据

4、通过 recv 接收数据

5、close socket

对于 server 端和 client 端的每个步骤,其都是有关联的,比如 client 端调用 connect 之后,server 端将从 accept 函数返回,其返回值是新连接的 socket 等等。下面,我们将以一个图的方式来了解两端的联系。

详述

socket()

#include <sys/socket.h>

int socket (int domain, int type, int protocol);

socket 系统调用通过分配一个新的描述符来创建一个新的套接字。它唯一标识一个 socket。这个 socket 描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。成功时返回一个非负的文件描述符编号,错误时返回-1。

  • domain:即协议域,又称为协议族(family)。常用的协议族有,AF_INET(IPv4)、AF_INET6(IPv6)、AF_LOCAL(或称 AF_UNIX,Unix 域 socket)、AF_ROUTE 等等。
  • type:指定 socket 类型。常用的 socket 类型有,SOCK_STREAM(流式套接字)、SOCK_DGRAM(数据报式套接字)、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET 等等
  • protocol:就是指定协议。常用的协议有,IPPROTO_TCP、PPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC 等,它们分别对应 TCP 传输协议、UDP 传输协议、STCP 传输协议、TIPC 传输协议。

在此,需要注意的是,并不是上面的 type 和 protocol 可以随意组合的,如 SOCK_STREAM 不可以跟 IPPROTO_UDP 组合。当 protocol 为 0 时,会自动选择 type 类型对应的默认协议。由于数据流的 IP 协议就是 TCP,前两个参数已经有效地指定了 TCP。 因此,第三个参数可以保留为 0,让操作系统分配一个默认协议(这将是 IPPROTO_TCP)。

bind()

 #include <sys/types.h>          /* See NOTES */
 #include <sys/socket.h>

 int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

bind 函数用来绑定 socket 的本地地址和端口号。

  • sockfd 是待绑定的 socket 对应的文件描述符。
  • addr 一个 const struct sockaddr *指针,指向要绑定给 sockfd 的协议地址。
  • addrlen 必须是结构体的大小 sockaddr_in(或正在使用的任何结构)。
struct in_addr {
u_int32_t s_addr;
};

struct sockaddr_in {
short sin_family;
u_short sin_port;
struct in_addr sin_addr;
char sin_zero[8];
};

sin_port 指定要使用的 16 位端口号。它在网络中给出(大端)字节顺序,因此必须使用 htons 将主机字节顺序转换为网络字节顺序。

将 sin 端口值指定为 0 会告诉操作系统选择端口号。操作系统将在 1024 和 5000 之间选择一个未使用的端口号作为应用程序。注意只有超级用户才能绑定 1024 以下的端口号。

对于 bind 系统调用,此处需要注意的是,在 client 不需要强制调用,而在 server 端需要强制调用,这是因为,在 server 端,bind 之后,要进行端口监听。而在 client 端,如果代码中没有执行此系统调用,则在内核中会隐式执行此调用。

connect()

#include <sys/types.h>          /* See NOTES */
#include <sys/socket.h>

int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

通过执行 connect 函数,与 server 端建立连接。

  • sockfd socket 对应的文件描述符。
  • addr 指定了对端的 ip 和端口。
  • addrlen 指定了上面结构体的大小

经典的三次握手,就在 connect 阶段,如下图:

listen()

 #include <sys/types.h>          /* See NOTES */
 #include <sys/socket.h>

 int listen(int sockfd, int backlog);

listen() 函数的主要作用就是将套接字( sockfd )变成被动的连接监听套接字(被动等待客户端的连接),至于参数 backlog 的作用是设置内核中连接队列的长度(该参数在现在大部分系统中已经不被使用),listen()的作用仅仅告诉内核一些信息。成功返回 0,否则返回-1.

  • sockfd 是绑定到要接受的端口的未连接套接字连接。
  • backlog 以前指定了操作系统在应用程序之前接受的连接数。 现在这个值已经没用了。

这里需要注意的是,listen()函数不会阻塞,它主要做的事情为,将该套接字和套接字对应的连接队列长度告诉 Linux 内核,然后,listen()函数就结束。

accept()

#include <sys/types.h>          /* See NOTES */
#include <sys/socket.h>

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);

accept()函数功能是,从处于 established 状态的连接队列头部取出一个已经完成的连接,如果这个队列没有已经完成的连接,accept()函数就会阻塞,直到取出队列中已完成的用户连接为止。 如果没有客户端连接,accept 将阻塞直到一个 做。 错误返回 -1。

  • sockfd 指的是上面绑定以及 listen 的 socket 描述符
  • addr 在有连接过来的时候,里面的内容就是 client 端的信息
  • addrlen 上一个变量的长度

需要注意的是,accept 的功能并不是建立连接,而是从当前连接的等待队列中获取一条连接。

accept 的第一个参数为服务器的 socket 描述字,是服务器开始调用 socket()函数生成的,称为监听 socket 描述字;而 accept 函数返回的是已连接的 socket 描述字。一个服务器通常通常仅仅只创建一个监听 socket 描述字,它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接 socket 描述字,当服务器完成了对某个客户的服务,相应的已连接 socket 描述字就被关闭。

send()

#include <sys/types.h>
#include <sys/socket.h>

ssize_t send(int sockfd, const void *buf, size_t len, int flags);

向指定 socket 发送数据。

  • sockfd 指定 socket 描述符
  • buf 待发送的数据 buf
  • len 数据 buf 长度
  • flags 发送标记。其值为 MSG_CONFIRM MSG_DONTROUTE MSG_DONTWAIT MSG_EOR MSG_MORE MSG_NOSIGNAL MSG_OOB 中 1 个或者几个的逻辑或或者逻辑与值

对于 send()的详细讲解,请转阅 TCP之send&recv

recv()

#include <sys/types.h>
#include <sys/socket.h>

ssize_t recv(int sockfd, void *buf, size_t len, int flags);

从指定socket中读取数据。

  • sockfd 指定 socket 描述符
  • buf 接收数据 buf
  • len 接收数据buf 长度
  • flags 发送标记。其值为 MSG_CMSG_CLOEXEC MSG_DONTWAIT MSG_ERRQUEUE MSG_OOB MSG_PEEK MSG_TRUNC MSG_WAITALL 中 1 个或者几个的逻辑或或者逻辑与值

对于 recv()的详细讲解,请转阅 TCP之send&recv

close()

 #include <unistd.h>

 int close(int fd);

关闭socket。

  • fd为待关闭的文件描述符

close 一个套接字的默认行为是把套接字标记为已关闭,然后立即返回到调用进程,该套接字描述符不能再由调用进程使用,也就是说它不能再作为send或recv的第一个参数,然而TCP将尝试发送已排队等待发送到对端,发送完毕后发生的是正常的TCP连接终止序列。 在多进程并发服务器中,父子进程共享着套接字,套接字描述符引用计数记录着共享着的进程个数,当父进程或某一子进程close掉套接字时,描述符引用计数会相应的减一,当引用计数仍大于零时,这个close调用就不会引发TCP的四路握手断连过程。 四次挥手就在这个步骤。

结语

本文从一个代码示例入手,讲解了tcp整个过程中各个系统调用函数的功能,以便从一个整体上层视角去观察整个tcp的编码以及运行过程。 tcp确实太复杂了,笔者调研和阅读了大量的文章,才有了该系列文章,可能会由于调研不充分,难免有欠缺或者错误的地方,读者可以联系本人。如果说有技术方面的问题或者心得,都可以与笔者联系沟通,共同学习。

高性能架构探索

2021/08/27  阅读:37  主题:默认主题

作者介绍

高性能架构探索