C#中TCP粘包问题的解决方法

时间:2022-01-26 00:15:49

一、tcp粘包产生的原理

1.tcp粘包是指发送方发送的若干包数据到接收方接收时粘成一包,从接收缓冲区看,后一包数据的头紧接着前一包数据的尾。出现粘包现象的原因是多方面的,它既可能由发送方造成,也可能由接收方造成。

2.发送方引起的粘包是由tcp协议本身造成的,tcp为提高传输效率,发送方往往要收集到足够多的数据后才发送一包数据。若连续几次发送的数据都很少,通常tcp会根据优化算法把这些数据合成一包后一次发送出去,这样接收方就收到了粘包数据。接收方引起的粘包是由于接收方用户进程不及时接收数据,从而导致粘包现象。

3.这是因为接收方先把收到的数据放在系统接收缓冲区,用户进程从该缓冲区取数据,若下一包数据到达时前一包数据尚未被用户进程取走,则下一包数据放到系统接收缓冲区时就接到前一包数据之后,而用户进程根据预先设定的缓冲区大小从系统接收缓冲区取数据,这样就一次取到了多包数据。、

二、解决原理及代码实现

1.采用包头(固定长度,里面存着包体的长度,发送时动态获取)+包体的传输机制。如图

C#中TCP粘包问题的解决方法

headersize 存放着包体的长度,其headersize本身是定长4字节;

一个完整的数据包(l)=headersize+bodysize;

2.分包算法

  其基本思路是首先将待处理的接收数据流即系统缓冲区数据(长度设为m)强行转换成预定的结构数据形式,并从中取出结构数据长度字段l,而后根据包头计算得到第一包数据长度。

       m=系统缓冲区大小;l=用户发送的数据包=headersize+bodysize;

1)若l<m,则表明数据流包含多包数据,从其头部截取若干个字节存入临时缓冲区,剩余部分数据依此继续循环处理,直至结束。

C#中TCP粘包问题的解决方法

2)若l=m,则表明数据流内容恰好是一完整结构数据(即用户自定义缓冲区等于系统接收缓冲区大小),直接将其存入临时缓冲区即可。

C#中TCP粘包问题的解决方法

3)若l>m,则表明数据流内容尚不够构成一完整结构数据,需留待与下一包数据合并后再行处理。

C#中TCP粘包问题的解决方法

4)下面是代码代码实现(hp-socket框架的服务器端来接收数据)

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
int headsize = 4;//包头长度 固定4
  byte[] surplusbuffer = null;//不完整的数据包,即用户自定义缓冲区
  /// <summary>
  /// 接收客户端发来的数据
  /// </summary>
  /// <param name="connid">每个客户的会话id</param>
  /// <param name="bytes">缓冲区数据</param>
  /// <returns></returns>
  private handleresult onreceive(intptr connid, byte[] bytes)
  {
   //bytes 为系统缓冲区数据
   //bytesread为系统缓冲区长度
   int bytesread = bytes.length;
   if (bytesread > 0)
   {
    if (surplusbuffer == null)//判断是不是第一次接收,为空说是第一次
     surplusbuffer = bytes;//把系统缓冲区数据放在自定义缓冲区里面
    else
     surplusbuffer = surplusbuffer.concat(bytes).toarray();//拼接上一次剩余的包
    //已经完成读取每个数据包长度
    int haveread = 0;
    //这里totallen的长度有可能大于缓冲区大小的(因为 这里的surplusbuffer 是系统缓冲区+不完整的数据包)
    int totallen = surplusbuffer.length;
    while (haveread <= totallen)
    {
     //如果在n此拆解后剩余的数据包连一个包头的长度都不够
     //说明是上次读取n个完整数据包后,剩下的最后一个非完整的数据包
     if (totallen - haveread < headsize)
     {
      byte[] bytesub = new byte[totallen - haveread];
      //把剩下不够一个完整的数据包存起来
      buffer.blockcopy(surplusbuffer, haveread, bytesub, 0, totallen - haveread);
      surplusbuffer = bytesub;
      totallen = 0;
      break;
     }
     //如果够了一个完整包,则读取包头的数据
     byte[] headbyte = new byte[headsize];
     buffer.blockcopy(surplusbuffer, haveread, headbyte, 0, headsize);//从缓冲区里读取包头的字节
     int bodysize = bitconverter.toint32(headbyte, 0);//从包头里面分析出包体的长度
 
     //这里的 haveread=等于n个数据包的长度 从0开始;0,1,2,3....n
     //如果自定义缓冲区拆解n个包后的长度 大于 总长度,说最后一段数据不够一个完整的包了,拆出来保存
     if (haveread + headsize + bodysize > totallen)
     {
      byte[] bytesub = new byte[totallen - haveread];
      buffer.blockcopy(surplusbuffer, haveread, bytesub, 0, totallen - haveread);
      surplusbuffer = bytesub;
      break;
     }
     else
     {
      //挨个分解每个包,解析成实际文字
      string strc = encoding.utf8.getstring(surplusbuffer, haveread + headsize, bodysize);
      //addmsg(string.format(" > [onreceive] -> {0}", strc));
      //依次累加当前的数据包的长度
      haveread = haveread + headsize + bodysize;
      if (headsize + bodysize == bytesread)//如果当前接收的数据包长度正好等于缓冲区长度,则待拼接的不规则数据长度归0
      {
       surplusbuffer = null;//设置空 回到原始状态
       totallen = 0;//清0
      }
     }
    }
   }
   return handleresult.ok;
  }

值此完成拆包解析文字工作。但实际上还没完成,如果这段代码是客户端接收来自服务器的数据的话就没问题了。

仔细看intptr connid 每个连接的会话id

private handleresult onreceive(intptr connid, byte[] bytes)

{

}

但是服务器端还要分辨出 每个数据包是哪个会话产生的,因为服务器端是多线程,多用户的模式,第一个数据包和第二个可能来自不同会话的数据,所以上面的代码只适用于单会话模式。

下面我要解决这个问题。

采用c#安全的concurrentdictionary,具体参考

最新的代码

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
//线程安全的字典
  concurrentdictionary<intptr, byte[]> dic = new concurrentdictionary<intptr, byte[]>();
  int headsize = 4;//包头长度 固定4
  /// <summary>
  /// 接收客户端发来的数据
  /// </summary>
  /// <param name="connid">每个客户的会话id</param>
  /// <param name="bytes">缓冲区数据</param>
  /// <returns></returns>
  private handleresult onreceive(intptr connid, byte[] bytes)
  {
   //bytes 为系统缓冲区数据
   //bytesread为系统缓冲区长度
   int bytesread = bytes.length;
   if (bytesread > 0)
   {
    byte[] surplusbuffer = null;
    if (dic.trygetvalue(connid, out surplusbuffer))
    {
     byte[] curbuffer = surplusbuffer.concat(bytes).toarray();//拼接上一次剩余的包
     //更新会话id 的最新字节
     dic.tryupdate(connid, curbuffer, surplusbuffer);
     surplusbuffer = curbuffer;//同步
    }
    else
    {
     //添加会话id的bytes
     dic.tryadd(connid, bytes);
     surplusbuffer = bytes;//同步
    }
 
    //已经完成读取每个数据包长度
    int haveread = 0;
    //这里totallen的长度有可能大于缓冲区大小的(因为 这里的surplusbuffer 是系统缓冲区+不完整的数据包)
    int totallen = surplusbuffer.length;
    while (haveread <= totallen)
    {
     //如果在n此拆解后剩余的数据包连一个包头的长度都不够
     //说明是上次读取n个完整数据包后,剩下的最后一个非完整的数据包
     if (totallen - haveread < headsize)
     {
      byte[] bytesub = new byte[totallen - haveread];
      //把剩下不够一个完整的数据包存起来
      buffer.blockcopy(surplusbuffer, haveread, bytesub, 0, totallen - haveread);
      dic.tryupdate(connid, bytesub, surplusbuffer);
      surplusbuffer = bytesub;
      totallen = 0;
      break;
     }
     //如果够了一个完整包,则读取包头的数据
     byte[] headbyte = new byte[headsize];
     buffer.blockcopy(surplusbuffer, haveread, headbyte, 0, headsize);//从缓冲区里读取包头的字节
     int bodysize = bitconverter.toint32(headbyte, 0);//从包头里面分析出包体的长度
 
     //这里的 haveread=等于n个数据包的长度 从0开始;0,1,2,3....n
     //如果自定义缓冲区拆解n个包后的长度 大于 总长度,说最后一段数据不够一个完整的包了,拆出来保存
     if (haveread + headsize + bodysize > totallen)
     {
      byte[] bytesub = new byte[totallen - haveread];
      buffer.blockcopy(surplusbuffer, haveread, bytesub, 0, totallen - haveread);
      dic.tryupdate(connid, bytesub, surplusbuffer);
      surplusbuffer = bytesub;
      break;
     }
     else
     {
      //挨个分解每个包,解析成实际文字
      string strc = encoding.utf8.getstring(surplusbuffer, haveread + headsize, bodysize);
      addmsg(string.format(" > {0}[onreceive] -> {1}", connid, strc));
      //依次累加当前的数据包的长度
      haveread = haveread + headsize + bodysize;
      if (headsize + bodysize == bytesread)//如果当前接收的数据包长度正好等于缓冲区长度,则待拼接的不规则数据长度归0
      {
       byte[] xbtye=null;
       dic.tryremove(connid, out xbtye);
       surplusbuffer = null;//设置空 回到原始状态
       totallen = 0;//清0
      }
     }
    }
   }
   return handleresult.ok;
  }

这样就解决了,多客户端会话造成的接收混乱。至此所有工作完成。以上代码就是为了参考学习,如果实在不想这么麻烦。可以直接使用hp-socket通信框架的pack模型,里面自动实现了解决粘包的问题。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。