GBK:
中国人的字符很多,大概有9万多个,用一个字节去存储完全不够用,所以中国人一般采用2个字节编码一个中文字符,这样大概可以存储6万多个信息(常用的信息也就6万多个),这套编码叫GBK编码,它必须兼容ASCII编码表。
ASCII:
因为美国人的字母信息较少,使用8个二进制(2的8次方为256)完全够用,一个字节存储一个字符完全够用,所以美国人使用ASCII编码。
UTF-8:
由美国人收集全球所有的字符,统一编号,这套编码叫UNICODE编码(万国码),utf-8就是一种变种形式,utf-8一个中文一般占3个字节,它也必须兼容ASCII编码表。
总结:
1、英文和数字在任何编码集中都是一样的,都占一个字节。
2、GBK编码中,一个中文字符一般占2个字节。
3、UTF-8编码中,一个中文字符一般占3个字节。
4、技术人员都应该使用utf-8编码。
标签:字符,UTF,字节,编码,GBK,ASCII 来源: https://blog.csdn.net/qq_38708372/article/details/121999990
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。