快速业务通道

深入剖析JSP和Servlet对中文的处理

作者 凌众技术 来源 互联网 浏览 发布时间 2012-01-14

的。

 

  当输出对象是数据库时

  输出到数据库时,原理与输出到浏览器也是一样的。本节只是Servlet为例,JSP的情况请读者自行推导。

  假设有一个Servlet,它能接收来自客户端(IE,简体中文)的汉字字符串,然后把它写入到内码为ISO8859-1的数据库中,然后再从数据库中取出这个字符串,显示到客户端。

  表9 输出对象是数据库时的变化过程(1)

  序号 步骤说明 结果 域 

  1 在IE中输入“中文” D6 D0 CE C4 IE 
  2 IE把字符串转变成UTF,并送入传输流中 E4 B8 AD E6 96 87 
  3 Servlet接收到输入流,用readUTF读取 4E 2D 65 87(unicode) Servlet 
  4 编程者在Servlet中必须把字符串根据GB2312还原为字节流 D6 D0 CE C4 
  5 编程者根据数据库内码ISO8859-1生成新的字符串 00 D6 00 D0 00 CE 00 C4 
  6 把新生成的字符串提交给JDBC 00 D6 00 D0 00 CE 00 C4 
  7 JDBC检测到数据库内码为ISO8859-1 00 D6 00 D0 00 CE 00 C4 JDBC 
  8 JDBC把接收到的字符串按照ISO8859-1生成字节流 D6 D0 CE C4 
  9 JDBC把字节流写入数据库中 D6 D0 CE C4 
  10 完成数据存储工作 D6 D0 CE C4 数据库 
  以下是从数据库中取出数的过程 
  11 JDBC从数据库中取出字节流 D6 D0 CE C4 JDBC 
  12 JDBC按照数据库的字符集ISO8859-1生成字符串,并提交给Servlet 00 D6 00 D0 00 CE 00 C4 (Unicode)   
  13 Servlet获得字符串 00 D6 00 D0 00 CE 00 C4 (Unicode) Servlet 
  14 编程者必须根据数据库的内码ISO8859-1还原成原始字节流 D6 D0 CE C4   
  15 编程者必须根据客户端字符集GB2312生成新的字符串 4E 2D 65 87
  (Unicode)   
  Servlet准备把字符串输出到客户端 
  16 Servlet根据<Servlet-charset>生成字节流 D6D0 CE C4 Servlet 
  17 Servlet把字节流输出到IE中,如果已指定<Servlet-charset>,还会设置IE的编码为<Servlet-charset> D6 D0 CE C4 
  18 IE根据指定的编码或默认编码查看结果 “中文”(正确显示) IE

  解释一下,表中第4第5步和第15第16步是用红色标记的,表示要由编码者来作转换。第4、5两步其实就是一句话:“new String(source.getBytes("GB2312"), "ISO

凌众科技专业提供服务器租用、服务器托管、企业邮局、虚拟主机等服务,公司网站:http://www.lingzhong.cn 为了给广大客户了解更多的技术信息,本技术文章收集来源于网络,凌众科技尊重文章作者的版权,如果有涉及你的版权有必要删除你的文章,请和我们联系。以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

分享到: 更多

Copyright ©1999-2011 厦门凌众科技有限公司 厦门优通互联科技开发有限公司 All rights reserved

地址(ADD):厦门软件园二期望海路63号701E(东南融通旁) 邮编(ZIP):361008

电话:0592-5908028 传真:0592-5908039 咨询信箱:web@lingzhong.cn 咨询OICQ:173723134

《中华人民共和国增值电信业务经营许可证》闽B2-20100024  ICP备案:闽ICP备05037997号