1个汉字字符存储需要2个字节,1个英文字符存储需要1个字节。ASCII是一个字节,Unicode是两个字节。Java的字符是Unicode的,所以是两个字节。字符是指计算机中使用的字母、数字、字和符号。
不同的编码里,字符和字节的对应关系也不同,与编码方式有关,常见的编码字符与字节的对应关系如下:
1、ASCII码中,一个英文字母(不分大小写)占一个字节的空间,一个中文汉字占两个字节的空间。一个二进制数字序列,在计算机中作为一个数字单元,一般为8位二进制数,换算为十进制,最小值0,最大值255。
2、UTF-8编码中,一个英文字符等于一个字节,一个中文(含繁体)等于三个字节。
3、Unicode编码中,一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文标点占一个字节,中文标点占两个字节。举例:英文句号“.”占1个字节的大小,中文句号“”占2个字节的大小。
4、GBK编码方式是中文占两个字节,英文占1个字节。
确定要研究的编码,比如UTF-8或者UTF-16 LE。要得到某个字符几个字节,两种办法:1. 根据编码的定义得出。(每种长度可扩展的编码都会规定在什么情况下这个字符是几个字节,比如上面那两种,都存在2字节和4字节的字符。)2. 动手实验判断。(保存为文本文件,用十六进制编辑器打开查看。)。
一个字等于多少个字节,与系统硬件(总线、cpu命令字位数等)有关,不应该毫无前提地说一个字等于多少位。正确的说法:①:1字节(byte) = 8位(bit)②:在16位的系统中(比如8086微机) 1字 (word)= 2字节(byte)= 16(bit) 在32位的系统中(比如win32) 1字(word)= 4字节(byte)=32(bit) 在64位的系统中(比如win64)1字(word)= 8字节(byte)=64(bit)
标签:字符,字节,编码,几个,英文,bit,byte 来源: https://www.cnblogs.com/hangqqw/p/16639042.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。