快速业务通道

深入剖析JSP和Servlet对中文的处理

作者 凌众技术 来源 互联网 浏览 发布时间 2012-01-14

  4 运行时,先从CLASS文件中用readUTF读出字符串,在内存中的是Unicode编码 4E 2D 65 87(在Unicode中4E2D=中 6587=文) 
  5 根据Jsp-charset=GB2312把Unicode转化为字节流 D6 D0 CE C4 
  6 把字节流输出到IE中,并设置IE的编码为GB2312(作者按:这个信息隐藏在HTTP头中) D6 D0 CE C4 
  7 IE用“简体中文”查看结果 “中文”(正确显示)

 

  如果指定了<Jsp-charset>为ISO8859-1,转化过程如下表。

  表5 Jsp-charset = ISO8859-1时的变化过程

  序号 步骤说明 结果 

  1 编写JSP源文件,且存为GB2312格式 D6 D0 CE C4
  (D6D0=中 CEC4=文) 
  2 jspc把JSP源文件转化为临时JAVA文件,并把字符串按照ISO8859-1映射到Unicode,并用UTF格式写入JAVA文件中 C3 96 C3 90 C3 8E C3 84 
  3 把临时JAVA文件编译成CLASS文件 C3 96 C3 90 C3 8E C3 84 
  4 运行时,先从CLASS文件中用readUTF读出字符串,在内存中的是Unicode编码 00 D6 00 D0 00 CE 00 C4
  (啥都不是!!!) 
  5 根据Jsp-charset=ISO8859-1把Unicode转化为字节流 D6 D0 CE C4 
  6 把字节流输出到IE中,并设置IE的编码为ISO8859-1(作者按:这个信息隐藏在HTTP头中) D6 D0 CE C4 
  7 IE用“西欧字符”查看结果 乱码,其实是四个ASCII字符,但由于大于128,所以显示出来的怪模怪样 
  8 改变IE的页面编码为“简体中文” “中文”(正确显示)

  奇怪了!为什么把<Jsp-charset>设成GB2312和ISO8859-1是一个样的,都能正确显示?因为表4表5中的第2步和第5步互逆,是相互“抵消”的。只不过当指定为ISO8859-1时,要增加第8步操作,殊为不便。

  再看看不指定<Jsp-charset> 时的情况。

  表6 未指定Jsp-charset 时的变化过程

  序号 步骤说明 结果 

  1 编写JSP源文件,且存为GB2312格式 D6 D0 CE C4
  (D6D0=中 CEC4=文) 
  2 jspc把JSP源文件转化为临时JAVA文件,并把字符串按照ISO8859-1映射到Unicode,并用UTF格式写入JAVA文件中 C3 96 C3 90 C3 8E C3 84 
  3 把临时JAVA文件编译成CLASS文件 C3 96 C3 90 C3 8E C3 84 
  4 运行时,先从CLASS文件中用readUTF读出字符串,在内存中的是Unicode编码 00 D6 00 D0 00 CE 00 C4 
  5

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

分享到: 更多

Copyright ©1999-2011 厦门凌众科技有限公司 厦门优通互联科技开发有限公司 All rights reserved

地址(ADD):厦门软件园二期望海路63号701E(东南融通旁) 邮编(ZIP):361008

电话:0592-5908028 传真:0592-5908039 咨询信箱:web@lingzhong.cn 咨询OICQ:173723134

《中华人民共和国增值电信业务经营许可证》闽B2-20100024  ICP备案:闽ICP备05037997号