在.NET程序中正确使用String类型

日期: 2008-05-27 来源:TechTarget中国

  我们分几个方面来谈这个问题:


  1、了解String数据的内存分配方式


  编写一个控制台应用程序,输入以下测试代码:


         class Program
  {


  static void Main(string[] args)


  {


  String s = “a”;


  s = “abcd”;


  }


  }
 
  使用.NET Framework 2.0 SDK提供的ildasm.exe工具查看生成的MSIL指令:


  01 .method private hidebysig static void Main(string[] args) cil managed
  02 {


  03 .entrypoint


  04 // 代码大小 14 (0xe)


  05 .maxstack 1


  06 .locals init ([0] string s)


  07 IL_0000: nop


  08 IL_0001: ldstr “a”


  09 IL_0006: stloc.0


  10 IL_0007: ldstr “abcd”


  11 IL_000c: stloc.0


  12 IL_000d: ret


  13 } // end of method Program::Main
 
  简要解释一下上述MSIL指令代码:


  第06句给局部变量s分配一个索引号(索引号从0开始,如函数中有多个局部变量,其索引号按在函数中出现的顺序加一)。


  在编译时编译器会将代码中的两个字串“a”和“abcd”写入到程序集的元数据(metadata)中,此时,这两个字串被称为“字串字面量(string literal)”。


  第08句使用ldstr指令为字串对象“a”分配内存,并将此对象引用压入到线程堆栈中。


  第09句使用stloc指令从线程堆栈顶弹出先前压入的对象引用,将其传给局部变量s(其索引号为0)。


  同样的过程对“abcd”重复进行一次,所以这两句简单的代码


  String s = “a”;


  s = “abcd”;


  将会导致CLR使用ldstr指令分配两次内存。


  根据上述分析,读者一定明白了String变量的内容是只读的,给其赋不同的值将会导致内存的重新分配。因此,为提高程序性能,编程时应尽量减少内存的分配操作。


  下面对代码中常见的字串用法进行分析,从中读者可以知道如何避免严重影响程序性能的字串操作。


  2、尽量少使用字串加法运算符


  请看以下两段代码:


  (1) String s1 = “ab”;


  s1+=”cd”;


  (2) String s1=”ab”+”cd”;


  这两段代码运行结果一样,但速度一样快吗?


  请看第(1)段代码生成的MSIL指令:


  .locals init ([0] string s1)
  IL_0000: nop


  IL_0001: ldstr “ab”


  IL_0006: stloc.0


  IL_0007: ldloc.0


  IL_0008: ldstr “cd”


  IL_000d: call string [mscorlib]System.String::Concat(string,


  string)


  IL_0012: stloc.0


  IL_0013: ret
 
  再看第(2)段代码生成的指令:


         .locals init ([0] string s1)
  IL_0000: nop


  IL_0001: ldstr “abcd”


  IL_0006: stloc.0


  IL_0007: ret
 
  可以很清楚地看到,第(1)段代码将导致String类的Concat()方法被调用(实现字串加法运算)。对于第(2)段代码,由于C#编译器聪明地在编译时直接将两个字串合并为一个字串字面量,所以程序运行时CLR只调用一次ldstr指令就完成了所有工作,其执行速度谁快就不言而喻了!


  3、避免使用加法运算符连接不同类型的数据


  请看以下代码:


         String str = “100+100=” + 200;
  Console.Writeline(str);
 
  生成的MSIL指令为:


  .maxstack 2
  .locals init ([0] string str)


  IL_0000: nop


  IL_0001: ldstr “100+100=”


  IL_0006: ldc.i4 0xc8


  IL_000b: box [mscorlib]System.Int32


  IL_0010: call string [mscorlib]System.String::Concat(object,


  object)


  IL_0015: stloc.0


  IL_0016: ldloc.0


  IL_0017: call void [mscorlib]System.Console::WriteLine(string)


  IL_001c: nop


  IL_001d: ret
 
  可以清晰地看到,这两句C#代码不仅导致了String类的Concat()方法被调用(IL_0010),而且还引发了装箱操作(IL_000b)!


  Concat()方法会导致CLR为新字串分配内存空间,而装箱操作不仅要分配内存,还需要创建一个匿名对象,对象创建之后还必须有一个数据复制的过程,代价不菲!


  改为以下代码:


         String str = “100+100=”;
  Console.Write(str);


  Console.WriteLine(200);
 
  生成的MSIL指令为:


         .maxstack 1
  .locals init ([0] string str)


  IL_0000: nop


  IL_0001: ldstr “100+100=”


  IL_0006: stloc.0


  IL_0007: ldloc.0


  IL_0008: call void [mscorlib]System.Console::Write(string)


  IL_000d: nop


  IL_000e: ldc.i4 0xc8


  IL_0013: call void [mscorlib]System.Console::WriteLine(int32)


  IL_0018: nop


  IL_0019: ret
 
  可以看到,虽然多了一次方法调用(Console.Write)方法,但却避免了复杂的装箱操作,也避免了调用String.Concat()方法对内存的频繁分配操作,性能更好。


  4.在循环中使用StringBuilder代替String实现字串连接


  在某些场合需要动态地将多个子串连接成一个大字串,比如许多复杂的SQL命令都是通过循环语句生成的。这时,应避免使用String类的加法运算符,举个简单的实例:


  String str =””;
  for (int i = 1; i <= 10; i++)


  {


  str += i;


  if(i<10)


  str += “+”;


  }
 
  上述代码将生成一个字串:1+2+…+10。


  有了前面的知识,读者一定知道这将导致进行10次装箱操作,19次字串内存分配操作(由String.Concat()方法引发),由于生成的MSIL指令太长,此处不再列出,请读者自行用ildasm.exe工具查看上述代码生成的MSIL指令。


  改为以下代码,程序性能会好很多:


  //预先分配1K的内存空间


         StringBuilder sb = new StringBuilder(1024);
  for (int i = 1; i <= 10; i++)


  {


  sb.Append(i);


  if(i<10)


  sb.Append(“+”);


  }


  String result = sb.ToString();
 
  通过使用ildasm.exe工具查看生成的MSIL代码,发现虽然上述代码生成的MSIL指令比前面多了7条,但却避免了耗时的装箱操作,而且内存分配的次数也少了很多。当循环的次数很大时,两段代码的运行性能差异很大。

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

相关推荐