那些年JavaWeb的各种中文乱码终极解决方法！！ -

lqwforever

浏览: 32400 次
性别:
来自: 武汉

最近访客更多访客>>

jw1314

aop

elf8848

cl_andywin

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

那些年JavaWeb的各种中文乱码终极解决方法！！

博客分类：

Java Web

中文乱码

一、Servlet输出乱码
1. 用servlet.getOutStream字节流输出中文，假设要输出的是String str ="钓鱼岛是中国的，无耻才是日本的"。
           1.1 若是本地服务器与本地客户端这种就不用说了，直接可以out.write(str.getBytes())可以输出没有问题。因为服务器中用str.getBytes()是采用默认本地的编码，比如GBK。而浏览器也解析时也用本地默认编码，两者是统一的，所以没有问题。
          1.1 若服务器输出时用了out.write(str.getBytes("utf-8"))，而本地默认编码是GBK时(比例在中国)，那么用浏览器打开时就会乱码。因为服务器发送过来的是utf-8的1010数据，而客户端浏览器用了gbk来解码，两者编码不统一，肯定是乱码。当然，你也可以自己将客户端浏览器的编码手工调用下(IE菜单是：查询View->编码encoding->utf-8)，但是这种操作很烂，最好由服务器输出响应头告诉，浏览器用哪种编码来解码。所以要在服务器的servlet中，增加response.setHeader("content-type","text/html;charset=utf-8")，当然也可直接用简单的response.setContentType("text/hmtl;charset=utf-8")。两种的操作是一样一样的。
2. 用servlet.getWirter字符流输出中文，假设要输出的是String str ="钓鱼岛是中国的，无耻才是日本的"。
        2.1 若写成out.print(str)输出时，客户端浏览器显示的将全是多个?????的字符，代表在编码表中肯定就找不到相应的字符来显示。原因是：servlet.getWriter()得到的字符输出流，默认对字符的输出是采用ISO-8859-1，而ISO-8859-1肯定是不支持中文的。所以肯定要首先要做的第一件事：是要将服务器对象输出字符能支持中文的。其次服务器向客户端写回的响应头要告诉客户端是用了哪种编码表进行编码的。而实现这两个需求，只需要response.setContentType("text/hmtl;charset=utf-8")就搞定了。
特别注意：response.setContentType("text/html;charset=utf-8")要放在PrintOut out = response.getWriter()代码的前面，否则只是有告诉客户端用什么码表编码的功能，而服务器端还是用ISO-8859-1编码了。再特别提示下：在同一Servlet中的doGet或doPost方法中，不能既用response.getOutputStream又用response.getWriter，因为这两种response的响应输出字节流与字符流是冲突的，只能用其一。
二、Servlet文件下载，中文乱码情况
        关键是下载时响应头 content-disposition中attachment;filename=文件名。这个文件名filename不能是含有中文字符串的，要用URLEncoding编码进行编码，才能进行进行http的传输。如下代码示例：

//获取文件的URL地址 		
String realPath = getServletContext().getRealPath("/钓鱼岛是中国的无耻才是日本的历史证据.jpg");
//获取文件名： 钓鱼岛是中国的无耻才是日本的历史证据.jpg 		
String fileName = realPath.substring(realPath.lastIndexOf("\\")+1); 		
//指示响应流的类型不是text/html而是二进制流数据以指示下载
response.setContentType("application/octet-stream"); 		
//注意这里一般都用URLEncoder的encode方法进行对文件名进行编码 		
String enFileName = URLEncoder.encode(fileName, "utf-8");
//enFileName文件名若含有中文必须用URLEncoding进行编码
response.setHeader("content-disposition", "attachment;filename="+enFileName);
//文件读取与输出，模板代码了... 		
InputStream in = new FileInputStream(realPath); 		
OutputStream out = response.getOutputStream(); 		
int len = -1; 		
byte[] buf = new byte[1024]; 		
while((len=in.read(buf))!=-1){ 			
    out.write(buf, 0, len); 		
} 		
in.close();

三、Servlet的response增加addCookie，cookie中value的中文码问题解决方法
关于cookie的原理，见http://blog.csdn.net/chenshufei2/article/details/8009992。若想将cookie中存放中文的值，必须用Base64编码后，发给客户浏览器端进入存储。而下次客户端浏览访问是带回来的cookie中的值，是经过Base64编码的，所以需要用Base64解码即可。 Base64编码主要是解决将特殊字符进行重新编码，编码成a-b、A-B、0-9、+与/，字符52，10个数字与一个+，一个/ 共64个字符。它的原理是将原来3个字节的内容编码成4个字节。主要是取字节的6位后，在前面补00组成一个新的字节。所以这样原来的3个字节共24，被编码成4个字节32位了。
具体代码示例如下：

response.setContentType("text/html;charset=utf-8");
request.setCharacterEncoding("utf-8");
String getUserName = request.getParameter("username");
PrintWriter out = response.getWriter();
String username = null;
//获取客户端提交过来的cookie数组。
Cookie[] cookies = request.getCookies();
for (int i = 0; cookies != null && i < cookies.length; i++) {
//遍历cookie数组，找到含有username的key的cookie。
    if (Constant.USER_INFO.equals(cookies[i].getName())) {
        username = cookies[i].getValue();
        //得到cookie的值后必须进行Base64解码，因为前次生成cookie时value是经过Base64编码
        username = Base64Coder.decode(username);  //进行Base64解码
    } 		
}
//username从Cookie中得出来,getUserName从请求参数中
out.print(username + "，恭喜您登录成功......"+getUserName);
System.out.println(username+"------------");
String remember = request.getParameter("remember");
//中文必须要进行 base64进行加码，才能作为cookie的值
getUserName = Base64Coder.encode(getUserName);
//将编码后的中文username的作为cookie的value 
Cookie cookie = new Cookie(Constant.USER_INFO, getUserName);
cookie.setPath(getServletContext().getContextPath());
if(null != remember){
//若选择中了，则将Cookie写进去，若没有选择中，则将以前的Cookie都置成空
    cookie.setMaxAge(Integer.MAX_VALUE); 
//设置Cookie是Integer最大数，好似有70多年的存效吧。呵呵
}else{
    cookie.setMaxAge(0); //设置成cookie马上失效，maxAge是cookie的存活时间
}
response.addCookie(cookie);

四、获取请求参数乱码
GET方式的乱码：
如<a href=”/demo5/servlet/RD2?name=中国”>CN</a>，直接用request.getParameter得到的字符串strCN将会乱码，这也是因为GET方式是用http的url传过来的默认用iso-8859-1编码的，所以首先得到的strCn要再用iso-8859-1编码得到原文后，再进行用utf-8(看具体页面的charset是什么utf-8或gbk)进行解码即可。new String(strCn.getBytes(“ISO-8859-1”),“UTF-8”);

String strCn = request.getParameter("name"); 
String name = new String(strCn.getBytes(“ISO-8859-1”),“UTF-8”);

这种方式操作比较麻烦的是，有一个参数要用iso-8859-1编码一次再解码一次。
POST方式的乱码：只需要request.setCharacterEncoding("UTF-8"):即可

request.setCharacterEncoding("UTF-8"); 
String name = request.getParameter("name");

转自：http://blog.csdn.net/chenshufei2/article/details/8010149

分享到：

ServletContext 与application的异同 | 32位CPU的机器只能支持4GB的内存吗

2012-09-29 09:53
浏览 695
评论(0)
分类:Web前端
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

那些年JavaWeb的各种中文乱码终极解决方法！！

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

那些年JavaWeb的各种中文乱码终极解决方法！！

评论

发表评论

相关推荐

仿webqq桌面–jquery desktop 2.0

jsp速度优化七种方法

JDOM创建XML例子

file的getPath getAbsolutePath和getCanonicalPath的不同

ServletContext 与application的异同

Servlet 中文乱码问题及解决方案剖析

最近访客更多访客>>