一、ASCII字符集(American Standard Code for Information Interchage)
128个字符(96个可打印字符+32个控制字符)2^7——7位二进制数表示一个字符
一个字节存放一个ASCII字符
二、MBCS多字节字符集(Multi-Bytes Charcter Set),又称“ANSI编码”
中文系统:ANSI编码代表GB 2312
GB 2312-1980:6763个常用汉字和682个的非全角汉字字符
GBK-1995(Chinese Internal Code Specification):21003个汉字+图形符号 883 个图形符号
GB 18030-2000:27533个汉字
GB 18030-2005:70244个汉字
台湾、香港及澳门:Big5(大五码)——繁体汉字13053个+808个标点符号、希腊字母及特殊符号
日文系统:ANSI编码代表JIS
韩文系统:ANSI编码代表KS
三、UNICODE,UCS(Universal Multiple-Octet Coded Character Set)——ISO国际标准化组织,包括了地球上所有文化、所有字母和符号的编码
一个字符就是两个字节 2^16=65536
UTF(UCS Transfer Format)
三、解决乱码中心思想——什么方式编码就用什么方式解码
标签:编码,字节,字符,汉字,ANSI,GB 来源: https://www.cnblogs.com/simonalwayson/p/15177051.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。