1. 什么是socket

socket可以看成是用户进程与内核网络协议栈的编程接口。TCP/IP协议的底层部分已经被内核实现了，而应用层是用户需要实现的，这部分程序工作在用户空间。用户空间的程序需要通过套接字来访问内核网络协议栈。

套接口是全双工的通信，它不仅可以用于本机的进程间通信，还可以用于网络上不同主机的进程间通信。

套接字还可以异构系统间进行通信，异构系统指的是在硬件或软件上有所差别的系统，例如安卓系统的手机与windows系统的PC机上都可以实现QQ通信，套接字可以实现在这两个设备上的通信。

2. IPV4套接口地址结构

套接口既然能够连接两个端系统，那它就需要一个地址来标记该端系统，例如两个电话需要电话号码来标记才可以进行拨号。这抽象成套接口的地址结构。IPV4套接口地址结构通常也称为“网际套接字地址结构”，它以sockaddr_in命名，定义在头文件< netinet/in/h >中。



struct sockaddr_in{

    uint8_t sin_len;

    sa_family_t sin_family;

    in_port_t sin_port;

    struct in_addr sin_addr;

    char sin_zero[8];

};

说明：

sin_len:整个sockaddr_in结构体的长度，在4.3BSD-Reno版本之前的第一个成员是sin_family。
sin_family:指定带地址家族，在这里必须设置为AF_INET。socket在设计时不仅可以用于TCP/IP协议，它还可以用于其他协议，例如unix域协议，地址家族用于指定该套接字用于哪种协议。AF_INET表示用于IPV4协议。
sin_port:端口号，16位的无符号整数，能够表示到65535。2个字节。
sin_addr: IPV4的地址。4个字节的整数。
sin_zero:暂不使用，一般将其设置为0。

其中，struct in_addr仅仅是一个32位的无符号整数，可以在终端下输入man 7 ip进行查看：

Socket编程实践(1) 基本概念

接下来看一下通用的地址结构。上面说过，socket可以用于不同的协议上，通用的地址结构可以用于任何协议的socket编程。



struct sockaddr{

    uint8_t sin_len;

    sa_family sin_family;

    char sa_data[14];

};

说明：

sin_len:整个sockaddr结构大小
sin_family:指定该地址家族
sa_data:由sin_family决定它的形式

可以看到，在通用地址结构中sa_data是14个字节，而在IPV4的地址结构中，sin_port、sin_addr、sin_zero三个变量加起来也等于14个字节。也即是说，这两种结构是兼容的。

3. 网络字节序

字节序可以分为大端字节序与小端字节序：

大端字节序(Big Endian) :最高有效位存储于最低内存地址处，最低有效位存储于最高地址内存处。
小端字节序(Little Endian):刚好与大端字节序倒过来，最高有效位存于最高内存地址处，最低有效位存储于最低内存地址处。

这样说起来挺抽象，通过一幅图来说明：

Socket编程实践(1) 基本概念

上面说过，socket可以用于异构系统之间的通信。而不同的系统采用的字节序可能是不同的，有的系统采用大端字节序，例如Motorola 6800；有的采用小端字节序，如X86。因此，在进行字节传输时，应该同一一个字节序，称为网络字节序。网络字节序采用大端字节序。如果主机A为小端字节序的系统，那么在传输时需要先将小端字节序转换成网络字节序。这需要一些字节序的转换函数。

我们可以编写程序来测试自己的主机是什么字节序：



#include<stdio.h>

int main(void)

{

        unsigned int x = 0x12345678;

        unsigned char *p = (unsigned char*)&x;

        printf("%0x,%0x,%0x,%0x\n",p[0],p[1],p[2],p[3]);

        return 0;

}

在我的电脑上输出结果为：78,56,34,12. 因此我的主机为小端字节序。

4. 字节序转换函数

如果主机的字节序与网络字节序不同，那么需要进行字节序的转换。下面是一些字节序转换函数：

   # include < arpa/inet.h >

   uint32_t htonl(uint32_t hostlong);

   uint16_t htons(uint16_t hostshort);

   uint32_t ntohl(uint32_t netlong);

   uint16_t ntohs(uint16_t netshort);

说明：h代表host；n代表network；s代表short；l代表long

描述：

htonl()函数将无符号整数hostlong从主机字节序转换成网络字节序。
htons()函数将无符号短整型hostshort从主机字节序转换成网络字节序。
ntohl()函数功能与 htonl()函数相反
ntohs()函数功能与htons()函数相反

我们可以进行验证，刚才已经通过程序测试出我的主机是小端字节序，接下来使用函数 htonl()将整数0x12345678转换成网络字节序。



#include<stdio.h>

#include <arpa/inet.h>

int main(void)

{

        unsigned int x = 0x12345678;

        unsigned char *p = (unsigned char*)&x;

        printf("转换前：%0x,%0x,%0x,%0x\n",p[0],p[1],p[2],p[3]);

        unsigned int y = htonl(x);

        p = (unsigned char *) &y;

        printf("转换后：%0x,%0x,%0x,%0x\n",p[0],p[1],p[2],p[3]);

        return 0;

}

结果输出：

转换前：78,56,34,12

转换后：12,34,56,78

5. 地址转换函数

对于IP地址，我们通常采用点分十进制的形式进行直观的认识，而程序更多的时候是处理32位的地址，因此需要有函数在点分十进制与32位地址这两种形式间进行转换。

   # include < sys/socket.h>

   # include < netinet/in.h>

   # include < arpa/inet.h>

   int inet_aton(const char *cp, struct in_addr *inp);

   in_addr_t inet_addr(const char *cp);

   char *inet_ntoa(struct in_addr in);

描述：

inet_addr()函数：表示将点分十进制的IP地址转换成32位的ip地址（整数）。
inet_ntoa()函数：将32位ip地址（网络字节序）转换成点分十进制的ip之地。

例程：



#include<stdio.h>

#include<arpa/inet.h>

int main()

{

        unsigned long addr = inet_addr("192.168.0.100");//将点分十进制转换为32bit地址

        printf("addr = %u\n",htonl(addr)); 

        struct in_addr ipaddr;

        ipaddr.s_addr = addr;

        printf("ipaddr = %s\n",inet_ntoa(ipaddr)); //网络字节序地址转换为点分十>进制

        return 0;

}

输出：

addr = 3232235620

ipaddr = 192.168.0.100

6. 套接字类型

套接字类型主要有三种：

流方套接字（SOCK_STREAM）：它对应TCP协议，它提供面向连接的、可靠的数据传输服务，数据无差错、无重复的发送，且按发送顺序接收。
数据报套接字（SOCK_DGREAM)：提供无连接服务。不提供无错保证，数据可能丢失或重复，并且接收顺序混乱。
原始套接字（SOCK_RAW）:它提供一种能力，让我们直接跨越传输层，直接对IP层进行数据封装，通过该套接字，我们可以直接将数据封装成IP层能够认识的协议格式。

文章连接：http://www.cnblogs.com/QG-whz/p/5426634.html

秒客网

Socket编程实践(1) 基本概念

1. 什么是socket

2. IPV4套接口地址结构

3. 网络字节序

4. 字节序转换函数

5. 地址转换函数

6. 套接字类型

相关文章