.Net高级技术——字符串拘留池(Intern)

时间:2023-03-09 15:55:00
.Net高级技术——字符串拘留池(Intern)

一、深入理解字符串的不可变特性

string可以看做是char的只读数组。char c = s[1]

C#中字符串有一个重要的特性:不可变性,字符串一旦声明就不再可以改变。所以只能通过索引来读取指定位置的char,不能对指定位置的char进行修改。如果要对char进行修改,那么就必须创建一个新的字符串,用s. ToCharArray()方法得到字符串的char数组,对数组进行修改后,调用new string(char[])这个构造函数来创建char数组的字符串。一旦字符串被创建,那么char数组的修改也不会造成字符串的变化。

常见疑问:“谁说字符串不可变?string s1 = "abc";s1="123"s1这不是变了吗”,要区分变量名和变量指向的值的区别:程序中可以有很多字符串,然后由字符串变量指向他们,变量可以指向其他的字符串,但是字符串本身没有变化。字符串不可变性指的是内存中的字符串不可变,而不是变量不变
string s2 = s1;//s2指向s1指向的字符串,而不是s2指向s1,哪怕s1以后指向了其他内存,那么s2还是指向"123"

内存分配分析:

string s1 = "abc";这句代码执行完之后,在栈内存中开辟一块内存空间存储字符串变量s1,在堆内存中开辟一块内存空间来存储字符串对象“abc”,字符串变量s1指向字符串对象“abc”,如下图所示:

.Net高级技术——字符串拘留池(Intern)

s1="123";这句代码执行完之后,在堆内存中再开辟一块内存空间来存储字符串对象“123”,字符串变量s1指向字符串对象“123”,如下图所示:

.Net高级技术——字符串拘留池(Intern)

此时可以看到,字符串变量s1已经指向了新的字符串对象“123”了,字符串对象“abc”已经没有任何的字符串变量指向它了,此时字符串对象“abc”就再也没有用了,当对象一定不再有用的时候GC(垃圾收集器)就可以将对象回收了,所以GC会在一个合适的时机来回收字符串对象“abc”,释放其占用的内存资源。判断一个对象是否一定不再有用的标准就是没有任何的变量指向它

string s2 = s1; 这句代码执行完之后,在栈内存中开辟一块内存空间存储字符串变量s2,字符串变量s2也指向字符串对象“123”

.Net高级技术——字符串拘留池(Intern)

例子:将字符串中的l替换为i

 string s = "hell world!";//字符数组 只读的 不能对其 进行赋值
char[] chars = s.ToCharArray();//得到一个字符数组
chars[]='i';//修改字符数组的值
s=new string(chars);//生成一个新的字符串
Console.WriteLine(s);
for (int i = ; i < s.Length; i++)
{
Console.WriteLine(s[i]);
}
Console.ReadKey();

  因为字符串是不可变的,所以CLR(CLR是公共语言运行时,Common Language Runtime)可能会将相同值的字符串用同一个实例。程序中大量使用字符串,有不少是重复性的,为了降低内存占用,.Net将代码中声明的字符串放到字符串拘留池中,值相同的字符串共享同一个实例。字符串是不变的。不是所有字符串都在拘留池中,.Net会判断哪些该放。

  object.ReferenceEquals方法判断两个变量是不是一个实例(同一个对象)

 string s1 = "abc";
string s2 = "abc";
Console.WriteLine(object.ReferenceEquals(s1,s2));

动态字符串默认是不在字符串拘留池中的

字符串拘留池测试程序:

 using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Drawing;
namespace 字符串拘留池
{
class Program
{
static void Main(string[] args)
{
//重点1
//因为有字符串拘留池的存在所以下面的程序有一个string对象
//string s1 = "孤傲苍狼";
//string s2 = "孤傲苍狼";
string s1 = "孤傲苍狼";
string s2 = "孤傲苍狼";
if (s1 == s2)//这里比较的是s1和s2的内容是不是一样
{
Console.WriteLine("s1==s2的结果是:{0}", s1 == s2);
}
//上面的代码产生一个字符串对象
Console.WriteLine("object.ReferenceEquals(s1,s2)的结果是:{0}",object.ReferenceEquals(s1,s2));//这里判断的是s1和s2所指向的对象是不是同一个
Console.WriteLine("================================================");
string s3 = "yzk";
string s4 = "yzk";
string s5 = new string(s1.ToCharArray());
//object.ReferenceEquals方法判断两个变量是不是一个实例(同一个对象)
Console.WriteLine("object.ReferenceEquals(s3, s4)的结果是:{0}",object.ReferenceEquals(s3, s4));//true
Console.WriteLine("object.ReferenceEquals(s3, s5)的结果是:{0}", object.ReferenceEquals(s3, s5));//false
Console.WriteLine("object.ReferenceEquals(s4, s5)的结果是:{0}", object.ReferenceEquals(s4, s5));//false
Console.WriteLine("================================================");
string s6 = "abc";
string s7 = "ab"+"c";
Console.WriteLine("object.ReferenceEquals(s6, s7)的结果是:{0}", object.ReferenceEquals(s6, s7));//true
//默认只有代码中写的字面才会进入字符串拘留池,动态字符串默认是不在字符串拘留池中的
string str1 = "abc";//abc就是代码中写的字面
string a1 = Console.ReadLine();
string a2 = Console.ReadLine();
string str2 = a1 + a2;//str2是动态算出来的字符串,
Console.WriteLine("str1==str2的结果是:{0}",str1==str2);//结果为true
Console.WriteLine("object.ReferenceEquals(str1, str2)的结果是:{0}", object.ReferenceEquals(str1, str2));//结果为false
//重点2
//new就一定会创建一个新的对象
//两个string对象
string str3 = new string("abc".ToCharArray());
string str4 = "abc";
//==是判断内容是否相等
Console.WriteLine("str3==str4的结果是:{0}", str3 == str4);//结果为true
Console.WriteLine("object.ReferenceEquals(str3, str4)的结果是:{0}", object.ReferenceEquals(str3, str4));//结果为false
Console.WriteLine("================================================");
Point p1 = new Point(, );
Point p2 = new Point(, );
//==是判断内容是否相等
Console.WriteLine("p1 == p2的结果是:{0}",p1 == p2);
//object.ReferenceEquals判断是否是同一个对象
Console.WriteLine("object.ReferenceEquals(p1, p2)的结果是:{0}", object.ReferenceEquals(p1, p2));
Console.WriteLine("================================================");
Console.ReadKey();
}
}
}

程序运行结果:

.Net高级技术——字符串拘留池(Intern)

  string是不变的,因此每次运算都会重新创建一个string对象,例如:s=s+”abc”;,此时将会创建一个新的字符串对象,s指向了新创建的字符串对象

 string s1=”a”;
string s2=”b”;
string s3=”c”;
string s4=s1+s2+s3;//s1+s2产生"ab","ab"+s3产生"abc",所以产生两个字符串

  大量的字符串相连会产生大量的中间字符串,字符串是对象,对象的产生是慢的,而且会占用大量的内存。所以要避免大量的字符串的连接操作。

  例如:在for循环中拼接字符串

 for(int i=;i<=;i++)
{
s=s+i.ToString();
}

  每循环一次,就进行一次字符串拼接运算,那么就会创建一个新的字符串,循环1000次,就会创建1000个字符串,就需要开辟1000块内存空间来存储这些中间字符串,这是非常暂用内存资源的。

  对象的创建是非常慢和消耗资源的,因此对于需要动态拼接字符串的场合(比如创建SQL语句)用StringBuilder来代替string,StringBuilder内部实现了字符串拼接不会有string的缺陷。