标签:UTF String 转码 GBK System println byte getBytes
java跟python类似的做法,在java中字符串的编码是java修改过的一种Unicode编码,所以看到java中的字符串,心理要默念这个东西是java修改过的一种Unicode编码的编码。
package string; import java.nio.charset.Charset; public class UTF82GBK { public static void main(String[] args) throws Exception { //系统的默认编码是GBK System.out.println("Default Charset=" + Charset.defaultCharset()); String t = "hfjkds中国中国中国中国中国中国中国中国中国中国中国中国中国中国中国中国中国中国中国中国hfsdkj<img src='sasa' /> fjldsajflkdsjaflkdsjalf <img src='sada' ait=''/>sfdsfadas"; //思路:先转为Unicode,然后转为GBK String utf8 = new String(t.getBytes( "UTF-8")); //等同于: // String utf8 = new String(t.getBytes( "UTF-8"),Charset.defaultCharset()); System.out.println(utf8); String unicode = new String(utf8.getBytes(),"UTF-8"); //等同于: // String unicode = new String(utf8.getBytes(Charset.defaultCharset()),"UTF-8"); System.out.println(unicode); String gbk = new String(unicode.getBytes("GBK")); //等同于: // String gbk = new String(unicode.getBytes("GBK"),Charset.defaultCharset()); System.out.println(gbk); } }
java string 的 byte中存储的其实 是 unicode 但是需要进行处理
byte[] bytes = s.getBytes(); for (byte aByte : bytes) { System.out.println("byte十进制:" + (256 + (int)aByte) + ";16进制:" + String.format("%08x", (256 + (int)aByte))); } System.out.println("------------------------"); byte[] gbks = s.getBytes("GBK"); for (byte aByte : gbks) { System.out.println("GBK-byte十进制 :" + (256 + (int)aByte) + ";16进制:" + String.format("%08x", (256 + (int)aByte))); } ------------ byte十进制:228;16进制:000000e4 byte十进制:184;16进制:000000b8 byte十进制:141;16进制:0000008d ------------------------ GBK-byte十进制 :178;16进制:000000b2 GBK-byte十进制 :187;16进制:000000bb
标签:UTF,String,转码,GBK,System,println,byte,getBytes 来源: https://www.cnblogs.com/qianxiaoPro/p/15784438.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。