UTF8是可变长的编码
1 UTF-8通过UNICODE转 所以每次编码都会变成最小
2 但解码的时候仍然可以识别多种编码
public class TestUTF8
{
public static void main(String [] args) throws Exception
{
byte[] bytes = {(byte)0xC0,(byte)0xB1};
String str = new String(bytes,"UTF-8");(
解码)
System.out.println(str.getBytes("UTF-8").length);(
通过unicode编码)
}
}
程序运行后打印的结果如下:
1
1
原因是
十六进制:C0 B1
二进制:11000000 10110001
对比两个字节编码的表示方式:
110xxxxx 10xxxxxx
提取出对应的UNICODE编码:
00000 110001
抽象类和接口的区别抽象类抽出象的部门 重在体现共同的部份 达到代码复用
接口扩展功能 重在表现不同的部分