关于JDK8中的字符串拼接示例详解

时间:2022-08-26 17:21:17

前言

在java开发者中,字符串拼接占用资源高往往是热议的话题.

让我们深入讨论一下为什么会占用高资源。

在java中,字符串对象是不可变的,意思是它一旦创建,你就无法再改变它。所以在我们拼接字符串的时候,创建了一个新的字符串,旧的被垃圾回收器所标记。

关于JDK8中的字符串拼接示例详解

如果我们处理上百万的字符串,然后,我们就会生成百万的额外字符串被垃圾回收器处理。

在大多数的教程中,也许你会看到用+号拼接字符串会生成多个string,导致性能过差,建议使用stringbuffer/stringbuilder来拼接。

可是真的是这样的吗?

本文在jdk8中做了如下实验:

?
1
2
3
4
5
public static void main(string[] args) {
 string result = "";
 result += "some more data";
 system.out.println(result);
 }

通过javap -c来反编译得到:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
code:
 0: aload_0  // push 'this' on to the stack
 1: invokespecial #1 // invoke object class constructor
    // pop 'this' ref from the stack
 4: return  // return from constructor
 
 public static void main(java.lang.string[]);
 code:
 0: ldc  #2 // load constant #2 on to the stack
 2: astore_1  // create local var from stack (pop #2)
 3: new  #3 // push new stringbuilder ref on stack
 6: dup  // duplicate value on top of the stack
 7: invokespecial #4 // invoke stringbuilder constructor
    // pop object reference
 10: aload_1  // push local variable containing #2
 11: invokevirtual #5 // invoke method stringbuilder.append()
    // pop obj reference + parameter
    // push result (stringbuilder ref)
 14: ldc  #6 // push "some more data" on the stack
 16: invokevirtual #5 // invoke stringbuilder.append
    // pop twice, push result
 19: invokevirtual #7 // invoke stringbuilder.tostring:();
 22: astore_1  // create local var from stack (pop #6)
 23: getstatic #8 // push value system.out:printstream
 26: aload_1  // push local variable containing #6
 27: invokevirtual #9 // invoke method printstream.println()
    // pop twice (object ref + parameter)
 30: return  // return void from method

可以看到java编译器优化了生成的字节码,自动创建了一个stringbuilder,并进行append操作。

由于构建最终字符串的子字符串在编译时已经已知了,在这种情况下java编译器才会进行如上的优化。这种优化称为a static string concatenation optimization,自jdk5时就开始启用。

那是否就能说明在jdk5以后,我们不再需要手动生成stringbuilder,通过+号也能达到同样的性能?

我们尝试下动态拼接字符串:

动态拼接字符串指的是仅在运行时才知道最终字符串的子字符串。比如在循环中增加字符串:

?
1
2
3
4
5
6
7
public static void main(string[] args) {
 string result = "";
 for (int i = 0; i < 10; i++) {
  result += "some more data";
 }
 system.out.println(result);
 }

同样反编译:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
code:
 0: aload_0  // push 'this' on to the stack
 1: invokespecial #1 // invoke object class constructor
    // pop 'this' ref from the stack
 4: return  // return from constructor
 
 public static void main(java.lang.string[]);
 code:
 0: ldc  #2 // load constant #2 on to the stack
 2: astore_1  // create local var from stack, pop #2
 3: iconst_0  // push value 0 onto the stack
 4: istore_2  // pop value and store it in local var
 5: iload_2  // push local var 2 on to the stack
 6: i2d  // convert int to double on
    // top of stack (pop + push)
 7: ldc2_w  #3 // push constant 10e6 on to the stack
 10: dcmpg  // compare two doubles on top of stack
    // pop twice, push result: -1, 0 or 1
 11: ifge  40 // if value on top of stack is greater
    // than or equal to 0 (pop once)
    // branch to instruction at code 40
 14: new  #5 // push new stringbuilder ref on stack
 17: dup  // duplicate value on top of the stack
 18: invokespecial #6 // invoke stringbuilder constructor
    // pop object reference
 21: aload_1  // push local var 1 (empty string)
    // on to the stack
 22: invokevirtual #7 // invoke stringbuilder.append
    // pop obj ref + param, push result
 25: ldc  #8 // push "some more data" on the stack
 27: invokevirtual #7 // invoke stringbuilder.append
    // pop obj ref + param, push result
 30: invokevirtual #9 // invoke stringbuilder.tostring
    // pop object reference
 33: astore_1  // create local var from stack (pop)
 34: iinc  2, 1 // increment local variable 2 by 1
 37: goto  5 // move to instruction at code 5
 40: getstatic #10 // push value system.out:printstream
 43: aload_1  // push local var 1 (result string)
 44: invokevirtual #11 // invoke method printstream.println()
    // pop twice (object ref + parameter)
 47: return  // return void from method

可以看到在14的时候new了stringbuilder,但是在37的时候goto到了5,在循环过程中,并没有达到最优化,不断在生成新的stringbuilder。

所以上述代码类似:

?
1
2
3
4
5
6
7
8
string result = "";
for (int i = 0; i < 10; i++) {
 stringbuilder tmp = new stringbuilder();
 tmp.append(result);
 tmp.append("some more data");
 result = tmp.tostring();
}
system.out.println(result);

可以看到不断生成新的stringbuilder,并且通过tostring,原来的stringbuilder将不再引用,作为垃圾,也增加了gc成本。

所以,在实际的使用中,当你无法区分字符串是静态拼接还是动态拼接的时候,还是使用stringbuilder吧。

reference:

http://www.pellegrino.link/2015/08/22/string-concatenation-with-java-8.html

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对服务器之家的支持。

原文链接:https://my.oschina.net/hosee/blog/1786130