TCP/IP网络编程 读书笔记1

时间:2023-03-09 15:39:25
TCP/IP网络编程 读书笔记1

本篇主干内容是TCP/IP网络编程1-9章学习笔记

1. linux文件描述符

描述符从3开始以由小到大的顺序编号,0,1,2,分配给标准I/O用作标准输入、标准输出和标准错误。

2. 协议族与套接字类型(socket函数第一、二个参数)

domain常用 : IPv4协议族 PF_INET;

type: SOCK_STREAM(面向连接,TCP), SOCK_DRGAM(面向消息, UDP)

选用TCP时,第三个参数可以为0。

3.地址族与数据序列

4字节IP地址分类:

A类地址: 首字节范围0~127(首位以0开始);

B类地址: 首字节范围128~191(前两位以10开始);

C类地址:首字节范围192~223(前3位以110开始).

端口号:操作系统参考端口号把数据传输给相应端口的套接字。端口号范围0~65535,其中0~1023位知名端口。

4.IPv4地址结构体

struct sockaddr_in {
sa_family_t sin_family; //地址族
uint16_t sin_port; //16位TCP/UDP端口号
struct in_addr sin_addr; //32位IP地址
char sin_zero[]; //补位,不使用
};

其中in_addr定义如下:

struct in_addr {
in_addr_t s_addr; //32位IPv4地址
}

注:1)sin_zero为了让sockaddr_in的大小与sockaddr结构体保持一致,便于传参的时候进行强制类型转换。

  2)为什么不直接填写sockaddr而要填写sockaddr_in再强转是因为sockaddr定义中一个sa_data[14]表示地址信息,不好填入。

  3)sockaddr_in是专为IPv4设计,但其仍然要传入地址族信息是由于sockaddr的要求,sockaddr中需要地址族信息(其不是为IPv4单独设计)。

5. 网络字节序

大端序:先保存高位字节,再保存低位字节;

例子存0x12345678,在大端序中,内存的分布为:

内存号 0x20号 0x21号 0x22号 0x23号
存储内容 0x12 0x34 0x56 0x78

小端序:先保存低位字节,再保存高位字节。

内存号 0x20号 0x21号 0x22号 0x23号
存储内容 0x78 0x56 0x34 0x12

CPU存储时多用小端序(Intel和AMD均是),网络字节序为大端序。

字节序转换函数:htons,htonl,ntohs,ntohl (h代表主机,n代表网络,l代表long,s代表short)。

注:除了向sockaddr_in结构体填充数据外,其余情况无需考虑字节序问题。

6. 网络地址初始化与分配

字符串形式的IP地址与32位整数型数据的转换:

#include <arpa/inet.h>

in_addr_t inet_addr(const char* s);          //成功返回32位大端序整数,失败返回INADDR_NONE 
int inet_aton(const char* s, struct in_addr* add) //成功返回1,失败返回0

二者功能相同,inet_addr需要将转换后的IP地址待遇sockaddr_in结构体声明的in_addr结构体变量中。

inet_aton则通过参数自动把结果填入该结构体遍历。

调用方法:

 if (!inet_aton(addr, &addr_inet.sin_addr)) { //addr存放字符串形式的IP地址(点分十进制)
error_handling("Conversion error");
}

INADDR_ANY可以自动获取IP地址,而不必手动输入。

7. TCP服务器端函数 (listen与等待连接请求;accept与受理连接请求)

#include <sys/socket.h>
int listen(int sock, int backlog); //backlog表示连接请求等待队列的长度

客户端请求连接时,受理之前一直使请求处于等待状态。

#include <sys/socket.h>
int accept(int sock, struct sockaddr* addr, socklen_t* addrlen);

addr保存发起连接请求的客户端地址信息的变量地址值。

accept函数受理连接请求等待队列中待处理的客户端连接请求。

函数调用成功后,accept函数内部产生用于数据I/O的套接字,并返回其文件描述符,这个套接字创建是自动的,并自动与发起连接请求的客户端建立连接。

8. TCP客户端函数 (connect与请求连接)

#include <sys/socket.h>
int connect(int sock, struct sockaddr* servaddr, socklen_t addrlen);

servaddr保持目标服务器端地址信息。

connect在服务器端接受连接请求后返回,但注意这里的接受连接是指把请求信息放在等待队列,所以connect函数返回后并不立即进行数据交换(等待accept).

9. TCP的服务器端/客户端函数调用关系

TCP/IP网络编程 读书笔记1

注:客户端只能等到服务器调用listen之后才能调用connect。但是在客户端调用connect之前,服务端可能率先调用accept,这时服务端进入阻塞状态,只到客户端调用connect函数为止。

10. TCP套接字中的I/O缓冲

write函数调用,数据移至输出缓冲;read函数调用,从输入缓冲读取数据。

1)I/O缓冲在每个TCP套接字中单独存在;

2)I/O缓冲在创建套接字时自动生成;

3) 即使关闭套接字也会继续传递输出缓冲中遗留的数据;

4)关闭套接字将丢失输入缓冲中的数据。

11. TCP的半关闭

1) 单方面断开可能带来的问题:

主机A调用close后,主机B传输给主机A的数据也无法接受。

2)

#include <sys/socket.h>
int shutdown(int sock, int howto);

howto取 SHUT_RD 断开输入流;SHUT_WR断开输出流; SHUT_RDWR同时断开I/O流

3)断开输出流时向对方主机传递EOF。

12 IP地址与域名的转换

IP地址比域名发生变更的频率高,利用IP域名编写程序是更好的选择,所以说,程序需要IP地址和域名之间的转换函数。

#include <netdb.h>
struct hostent* gethostbyname(const char* hostname);// 成果返回hostent结构体地址,失败返回NULL指针

关于hostent结构体:

struct hostent {
char* h_name; // official name
char** h_aliases; //alias list
int h_addrtype; //host address type
int h_length; //address length
char** h_addr_list; //address list
};

最重要的成员是 h_addr_list,可以通过此变量与整数形式保存域名对应的IP地址。用户较多的网站有可能分配多个IP给同一个域名。

h_addr_list指向字符串指针数组,字符串指针数组中的元素实际是in_addr结构体变量的地址值(声明为char*而不是in_addr*因为hostent不仅仅为IPv4准备)。

如下图:

TCP/IP网络编程 读书笔记1

13. 几个基础的套接字选项

1) 如何获取和更改套接字选项:

#include <sys/socket.h>
int getsockopt(int sock, int level, int optname, const void* optval, socklen_t* optlen); int setsockopt(int sock, int level, int optname, const void* optval, socklen_t* optlen);

sock:用于查看选项套接字的文件描述符;

level:要查看的可选项的协议层。有SOL_SOCKET(套接字相关), IPPROTO_IP(IP相关), IPPROTO_TCP(TCP协议相关)

optname:要查看的可选项名;

optval: 保持查看结果的缓冲地址值;

optlen:optval的缓冲大小。getsockopt调用函数后,保存可选项信息的字节数。

举例:(通过SO_TYPE查看套接字类型)

 int sock_type;
int tcp_sock = socket(PF_INET, SOCK_STREAM, );
int state = getsockopt(tcp_sock, SOL_SOCKET, SO_TYPE, (void*)&sock_type, &optlen);
if (state) {
error_handling("getsocket() error");
}
else {
printf("SOCKET_STREAM: %d \n", sock_type);
}

2) SO_SNDBUF & SO_REVBUF

SO_SNDBUF 是输入缓冲大小相关可选项;SO_REVBUF是输出缓冲大小相关可选项。

用这两个可选项既可以读取当前I/O缓冲大小, 也可以进行修改。(注:修改时不会完全按照请求更改大小)

3) SO_REUSEADDR 和 Time_wait

Time_wait存在的原因:

四次挥手中最后一个ACK(A回复的)可能在途中丢失,这样主机B会重传FIN消息。

但如果没有Time_wait状态,则主机A已经处在完全终止的状态,这个重传的信息便永远无法到达A。

基于这些考虑,先传FIN消息的主机应经过Time_wait状态。

Time_wait可能带来的问题:

网络状态不理想时,Time_wait会一直持续;想要快速重启服务器时,Time_wait导致必须等待几分钟。

SO_REUSEADDR可以将Time_wait状态下的套接字端口号重新分配给新的套接字:

 int optlen = sizeof(option);
int option = ;
setcsockopt(serv_sock, SOL_SOCKET, SO_REUSEADDR, (void*)&option, optlen);

注:客户端套接字端口号任意指定,所以每次运行程序时会动态分配端口号,故无需过多关注客户端Time_wait

参考文献:

尹圣雨 《TCP/IP网络编程》 https://book.douban.com/subject/25911735/