ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

不同的编码

2022-09-02 13:01:47  阅读:155  来源: 互联网

标签:编码 字节 字符 不同 字母 GB2312 Unicode


编码和解码的目的

编码:为了让机器能够识别人类的语言==即将字符数字化化成一个一个的二进制数。

解码:反过来。

由于语言的不同,诞生许多的编码类型,毕竟又不只有英语。

不同的编码格式

1. ASCIl编码

一个字符or字母用一个字节表示

将英文世界中的字母和其他符号(如 ! @ # 这类字符)用计算机中的一个字节来表示。

例如小写字母a的二进制数为0110 0001


 

2.GB2312编码

一个字符用二个字节表示

产生原因:为了解决无法识别汉字的问题

可以兼容ASCll


3.Unicode编码

一个字符or字母用二个字节表示

产生原因:为了统一每个国家特有的文字。

相当于国际通用编码器 日语法语啥统统识别。

问题:过于浪费空间。

 

4.utf-8编码(Unicode Transformation Format-8bit)

一个字符or字母用一个字节表示.一个汉字用二个字节表示

产生原因:unicode的简化版(用于英文字符居多的情况)。

一般运用在存储和传输的情形下。

但由于中英文编码字节长度不同,如使用在内存中会十分复杂(内存中多使用Unicode)。

5.GBK编码

GB2312编码的升级版,也支持希腊字母、日文假名字母、俄语字母等字符。

补充(关于编码的相互转换)

GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换

标签:编码,字节,字符,不同,字母,GB2312,Unicode
来源: https://www.cnblogs.com/a111l/p/16649449.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有