骑猪闯天下

J2ME随笔,记录成长的脚步

统计

留言簿(3)

阅读排行榜

评论排行榜

[Java-原创] bit、byte、位、字节、汉字、字符

bit、byte、位、字节、汉字的关系


        1 bit     = 1  二进制数据
        1 byte  = 8  bit
        1 字母 = 1  byte = 8 bit
        1 汉字 = 2  byte = 16 bit


1. bit:位
    一个二进制数据0或1,是1bit;

2. byte:字节
    存储空间的基本计量单位,如:MySQL中定义 VARCHAR(45)  即是指 45个字节;
    1 byte = 8 bit

3. 一个英文字符占一个字节;
    1 字母 = 1 byte = 8 bit

4. 一个汉字占2个字节;
    1 汉字 = 2 byte = 16 bit

5. 标点符号
    A>.  汉字输入状态下,默认为全角输入方式;
    B>.  英文输入状态下,默认为半角输入方式;

    C>.  全角输入方式下,标点符号占2字节;
    D>.  半角输入方式下,标点符号占1字节;

    故:汉字输入状态下的字符,占2个字节 (但不排除,自己更改了默认设置);
            英文输入状态下的字符,占1个字节 (但不排除,自己更改了默认设置);



        老美在发明电脑时,肯定以自己的英文字母--即他们自认为的字符为最小的存储计量单位,于是也就有了不规范的1字符=1byte, 岂不知还有我们伟大的汉字计量单位,NND,一个汉字也是一个字符,我们的1汉字字符就等于2byte,后来,他们可能意识到这个尴尬的问题,于是又标榜为:一个字母为一个标准字符,去球吧,谁整天没事说个字符还“标准字符”,所以啊,个人认为:字符,不能用于标准的计量单位。


--------------------------------
补充:
    计算机对各国语言的支持度,可分为以下三个阶段,如图:


更详细参考:http://www.regexlab.com/zh/encoding.htm 


<End>

posted on 2008-09-24 14:37 骑猪闯天下 阅读(12284) 评论(3)  编辑  收藏

评论

# re: [Java-原创] bit、byte、位、字节、汉字、字符 2008-09-24 16:07 sopofo

汉字这个和编码有关系
gb2312 gbk utf都不同  回复  更多评论   

# re: [Java-原创] bit、byte、位、字节、汉字、字符 2008-09-27 15:52 骑猪闯天下

@sopofo
这个问题说的好,完善一下  回复  更多评论   

# re: [Java-原创] bit、byte、位、字节、汉字、字符[未登录] 2009-09-10 17:26 sun

java 里 char 占2个字节
是char的都是2个字节
英文,汉字都是  回复  更多评论   


只有注册用户登录后才能发表评论。


网站导航: