吕鹏的blog

研究技术 探讨生活

常用链接

统计

最新评论

编码问题

UTF8是可变长的编码
1   UTF-8通过UNICODE转 所以每次编码都会变成最小
2   但解码的时候仍然可以识别多种编码
public class TestUTF8
{
   public static void main(String [] args) throws Exception
   {
       byte[] bytes = {(byte)0xC0,(byte)0xB1};
       String str = new String(bytes,"UTF-8");(解码
       System.out.println(str.getBytes("UTF-8").length);(通过unicode编码
   }
}
程序运行后打印的结果如下:
1
1
原因是
 
十六进制:C0 B1
二进制:11000000 10110001
对比两个字节编码的表示方式:
110xxxxx 10xxxxxx
提取出对应的UNICODE编码:
00000 110001

抽象类和接口的区别

抽象类抽出象的部门   重在体现共同的部份   达到代码复用
接口扩展功能   重在表现不同的部分 

posted on 2006-08-23 17:09 吕鹏 阅读(123) 评论(0)  编辑  收藏 所属分类: java技术心得


只有注册用户登录后才能发表评论。


网站导航: