Python全栈【Socket网络编程】

时间:2022-11-20 18:38:32
Python全栈【socket网络编程】

本章内容:

  1. Socket
  2. 基于TCP的套接字
  3. 基于UDP的套接字
  4. TCP粘包
  5. SocketServer 模块(ThreadingTCPServer源码剖析)

Socket

1、socket通常也称作"套接字"

用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。

socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)

socket和file的区别:

  • file模块是针对某个指定文件进行【打开】【读写】【关闭】
  • socket模块是针对 服务器端 和 客户端Socket 进行【打开】【读写】【关闭】

为何学习socket一定要先学习互联网协议:

1.首先:本节课程的目标就是教会你如何基于socket编程,来开发一款自己的C/S架构软件

2.其次:C/S架构的软件(软件属于应用层)是基于网络进行通信的

3.然后:网络的核心即一堆协议,协议即标准,你想开发一款基于网络通信的软件,就必须遵循这些标准。

2、socket层

Socket是应用层与TCP/IP协议族通信的中间软件抽象层,它是一组接口。在设计模式中,Socket其实就是一个门面模式,它把复杂的TCP/IP协议族隐藏在Socket接口后面,对用户来说,一组简单的接口就是全部,让Socket去组织数据,以符合指定的协议。

所以,我们无需深入理解tcp/udp协议,socket已经为我们封装好了,我们只需要遵循socket的规定去编程,写出的程序自然就是遵循tcp/udp标准的。

Python全栈【Socket网络编程】

Python全栈【Socket网络编程】

3、套接字有两种(或者称为有两个种族),分别是基于文件型的和基于网络型的。

1)基于文件类型的套接字家族

套接字家族的名字:AF_UNIX

unix一切皆文件,基于文件的套接字调用的就是底层的文件系统来取数据,两个套接字进程运行在同一机器,可以通过访问同一个文件系统间接完成通信

2)基于网络类型的套接字家族

套接字家族的名字:AF_INET

(还有AF_INET6被用于ipv6,还有一些其他的地址家族,不过,他们要么是只用于某个平台,要么就是已经被废弃,或者是很少被使用,或者是根本没有实现,所有地址家族中,AF_INET是使用最广泛的一个,python支持很多种地址家族,但是由于我们只关心网络编程,所以大部分时候我么只使用AF_INET)

4、套接字工作流程

服务器端先初始化Socket,然后与端口绑定(bind),对端口进行监听(listen),调用accept阻塞,等待客户端连接。在这时如果有个客户端初始化一个Socket,然后连接服务器(connect),如果连接成功,这时客户端与服务器端的连接就建立了。客户端发送数据请求,服务器端接收请求并处理请求,然后把回应数据发送给客户端,客户端读取数据,最后关闭连接,一次交互结束。

★TCP套接字工作流程(牢记)

Python全栈【Socket网络编程】

复习三次握手与四次挥手 

Python全栈【Socket网络编程】

socket类

sk = socket.socket(socket.AF_INET,socket.SOCK_STREAM,0)
参数一:地址簇

  socket.AF_INET IPv4(默认)
  socket.AF_INET6 IPv6

  socket.AF_UNIX 只能够用于单一的Unix系统进程间通信

参数二:类型

  socket.SOCK_STREAM  流式socket , for TCP (默认)
  socket.SOCK_DGRAM   数据报式socket , for UDP

参数三:协议

  0  (默认)与特定的地址家族相关的协议,如果是 0 ,则系统就会根据地址格式和套接类别,自动选择一个合适的协议

sk.bind(address)

  s.bind(address) 将套接字绑定到地址。address地址的格式取决于地址族。在AF_INET下,以元组(host,port)的形式表示地址。

sk.listen(backlog)

  开始监听传入连接。backlog指定在拒绝连接之前,可以挂起的最大连接数量。

      backlog等于5,表示内核已经接到了连接请求,但服务器还没有调用accept进行处理的连接个数最大为5
      这个值不能无限大,因为要在内核中维护连接队列

sk.setblocking(bool)

  是否阻塞(默认True),如果设置False,那么accept和recv时一旦无数据,则报错。

sk.accept()

  接受连接并返回(conn,address),其中conn是新的套接字对象,可以用来接收和发送数据。address是连接客户端的地址。

  接收TCP 客户的连接(阻塞式)等待连接的到来

sk.connect(address)

  连接到address处的套接字。一般,address的格式为元组(hostname,port),如果连接出错,返回socket.error错误。

sk.connect_ex(address)

  同上,只不过会有返回值,连接成功时返回 0 ,连接失败时候返回编码,例如:10061

sk.close()

  关闭套接字

sk.recv(bufsize[,flag])

  接受套接字的数据。数据以字符串形式返回,bufsize指定最多可以接收的数量。flag提供有关消息的其他信息,通常可以忽略。

sk.recvfrom(bufsize[.flag])

  与recv()类似,但返回值是(data,address)。其中data是包含接收数据的字符串,address是发送数据的套接字地址。

sk.send(string[,flag])

  将string中的数据发送到连接的套接字。返回值是要发送的字节数量,该数量可能小于string的字节大小。即:可能未将指定内容全部发送。

sk.sendall(string[,flag])

  将string中的数据发送到连接的套接字,但在返回之前会尝试发送所有数据。成功返回None,失败则抛出异常。

      内部通过递归调用send,将所有内容发送出去。

sk.sendto(string[,flag],address)

  将数据发送到套接字,address是形式为(ipaddr,port)的元组,指定远程地址。返回值是发送的字节数。该函数主要用于UDP协议。

sk.settimeout(timeout)

  设置套接字操作的超时期,timeout是一个浮点数,单位是秒。值为None表示没有超时期。一般,超时期应该在刚创建套接字时设置,因为它们可能用于连接的操作(如 client 连接最多等待5s )

sk.getpeername()

  返回连接套接字的远程地址。返回值通常是元组(ipaddr,port)。

sk.getsockname()

  返回套接字自己的地址。通常是一个元组(ipaddr,port)

sk.fileno()

  套接字的文件描述符
基于TCP的套接字

举例学习:模拟FTP文件上传及断点续传

 #tcp_server.py
 from socket import *

 ip_port = ('127.0.0.1',8000)
 buffer_size = 1024
 back_log = 5

 server = socket(AF_INET,SOCK_STREAM)
 server.bind(ip_port)
 server.listen(back_log)

 conn,addr = server.accept()

 f_size = int(str(conn.recv(buffer_size).decode('utf-8')))
 conn.send(bytes(str(f_size).encode('utf-8')))
 recv_size=0
 with open('2.txt', 'wb') as f:
     while True:
         if recv_size ==f_size:
             break
         else:
             recv_msg = conn.recv(buffer_size)
             f.write(recv_msg)
             recv_size += len(recv_msg)
 #tcp_client.py
 from socket import *
 import os
 ip_port = ('127.0.0.1',8000)
 buffer_size = 1024
 back_log = 5

 client = socket(AF_INET,SOCK_STREAM)
 client.connect(ip_port)

 file_size=os.stat('1.txt').st_size
 client.send(str(file_size).encode('utf-8')) #先发送文件大小,解决粘包问题
 msg = client.recv(buffer_size)

 have_rec = 0
 if int(str(msg.decode('utf-8'))) ==file_size:
     with open('1.txt', 'rb') as f:
         for line in f:
             client.send(line)
             have_rec+=len(line)
             print('模拟断点出现')
             break  # 模拟出现断点的情况再续传
     with open('1.txt', 'rb') as f:
         f.seek(have_rec) # 文件指针指到已经上传完成的部分
         for line in f:
             client.send(line)
基于UDP的套接字

 服务端

 from socket import *
 import time
 ip_port=('127.0.0.1',9000)
 BUFSIZE=1024
 udp_server=socket(AF_INET,SOCK_DGRAM)  #面向信息
 #UDP无连接,所以可以同时多个客户端去跟服务端通信
 udp_server.bind(ip_port) #需要绑定地址与端口号

 while True:
     msg,addr=udp_server.recvfrom(BUFSIZE)
     print(msg.decode('utf-8'),addr)   #hello ('127.0.0.1', 49448)
     if not msg:
         fmt ='%Y-%m-%d %X'
     else:
         fmt ='%Y:%m:%d %X'
     back_time = time.strftime(fmt)
     udp_server.sendto(back_time.encode('utf-8'),addr) #发送信息时需要后面带目的地址信息

客户端

 from socket import *
 ip_port=('127.0.0.1',9000)
 BUFSIZE=1024
 udp_client=socket(AF_INET,SOCK_DGRAM)

 while True:
     msg=input('>>: ').strip()
     if not msg:continue

     udp_client.sendto(msg.encode('utf-8'),ip_port) #发送带服务端地址信息

     back_msg,addr=udp_client.recvfrom(BUFSIZE)
     print(back_msg.decode('utf-8'))   #2017:01:03 09:24:48

UDP模拟Win下cmd命令(会丢包)

from socket import *
import subprocess
ip_port = ('127.0.0.1',8000)
back_log = 5
buffer_size = 1024

udp_server = socket(AF_INET,SOCK_DGRAM)
udp_server.bind(ip_port)

while True:
    cmd,addr = udp_server.recvfrom(buffer_size)
    print('新的客户端链接',addr)

    print('收到客户的命令是',cmd.decode('utf-8'))
    res = subprocess.Popen(cmd.decode('utf-8'),shell=True,
                           stderr = subprocess.PIPE,
                           stdout = subprocess.PIPE,
                           stdin = subprocess.PIPE)
    err = res.stderr.read()
    if err:
        cmd_res =err
    else:
        cmd_res = res.stdout.read()
    udp_server.sendto(cmd_res,addr)

server

from socket import *

ip_port = ('127.0.0.1',8000)
back_log = 5
buffer_size = 1024

udp_client = socket(AF_INET,SOCK_DGRAM)

while True:
    cmd =input('>>>').strip()
    if not cmd:continue
    if cmd =='quit':break

    udp_client.sendto(cmd.encode('utf-8'),ip_port)
    cmd_res,addr = udp_client.recvfrom(buffer_size)
    print('命令执行的结果是',cmd_res.decode('gbk'))
udp_client.close()

client

TCP粘包