Java学习之路

墙上芦苇,头重脚轻根底浅;山间竹笋,嘴尖皮厚腹中空。

常用链接

统计

最新评论

2009年3月21日 #

读书笔记:java的class文件格式分析(一)

阅读Java Virtual Machine Specification中的第四章,理解Java的class文件格式。

class文件由8位的字节流组成。

The ClassFile Structure

ClassFile{

u4 magic;

u2 minor_version;

u2 major_version;

u2 constant_pool_count;

cp_info constant_pool[constant_pool_count-1];

u2 access_flags;

u2 this_class;

u2 interfaces_count;

u2 interfaces[interfaces_count];

u2 fields_count;

field_info fields[fields_count];

u2 methods_count;

method_info methods[methods_count];

u2 attributes_count;

attribute_info attributes[attrributes_count];

}

说明:u2表示无符号2字节量,u4表示无符号4字节量。

各字段的说明:

magic

一般二进制文件中都有magic number这一项,这个数说明该文件是一个class文件,它的值是0xcAFEBABE。

minor_version,major_version

class文件的版本号。

constant_pool_count

常量池表中项目数加1得到。从后面的cp_info constant_pool[constant_pool_count-1];也容易理解这个值的意思。

cp_info constant_pool[]

存储该class文件中使用到的常量信息。

access_flag

说明该class文件的访问权限和相关属性,通过位掩码来设定。

Flag Name 解释
ACC_PUBLIC 0x0001 public
ACC_FINAL 0x0010 final
ACC_SUPER 0x0020 跟调用invokespecial指令时的处理有关
ACC_INTERFACE 0x0200 这是个接口
ACC_ABSTRACT 0x0400 abastract
ACC_SYNTHETIC 0x1000 没有在源代码中出现,该类是编译器生成的
ACC_ANNOTATION 0x2000 注解类型
ACC_ENUM 0x4000 枚举类型

 

这些属性都很容易理解,比如我们定义一个类public final Test{},则Test.class的access_flag中,ACC_PUBLIC和ACC_FINAL是置位的,而ACC_INTERFACE一项肯定是0。很多类似的组合规则倒是容易自己总结出来,比如如果ACC_INTERFACE置位了,那肯定ACC_ABSTRACT也是置位的,因为接口肯定是抽象的;如果ACC_ANNOTATION置位了,那ACC_ANNOTATION肯定同时置位,等等,诸如此类。

画一个具体的位示意图表示:

image

this_class

一个下标,指向常量池表中代表当前类的Constant_Class_info。

super_class

为0,或者为一个下标,指向常量池中代表其父类的Constant_Class_info。如果这个值为0,那么当前类肯定是Object类。如果当前类是一个接口,该下标指向的是Object类的描述信息。

interface_count

该类实现的接口数,或者该接口实现的超接口数。

interfaces[]

具体的接口信息,每一项都是常量池表中的一个下标,指向表示接口的Constant_Class_info。

后面几个依次是字段(field),方法(methods)和属性的描述,不再赘述,

 

下面具体的分析一个class文件。源文件很简单:

public class Test{
public static void main(String[] args){
System.out.println("Hello World!");
}
}

 

编译,得到Test.class文件,使用WinHex打开。

image

前4个字节是magic部分,内容为0xCAFEBABE;随后的4个字节是class文件的版本号,这里主版本号是0x0032,也就是50,这是使用jdk1.6编译出的class文件。再后面的2个字节是常量池表的大小信息,0x001D,也就是29,说明常量池表中一共有28项。为了方便观察,可以使用javap -verbose Test得到的结果和当前的二进制文件进行对比。

入门到此,以后继续。

posted @ 2009-03-23 12:20 Zang XT 阅读(121) | 评论 (0)编辑 收藏

学习目标

       以一种玩的心态学习java,关注java的编译实现和java虚拟机原理,暂时不去关注java相关的各种应用。目标不能太多,更不能太高,切忌!
几个具体的,可操作的目标:
       class文件格式分析。根据jvm规范中的定义,理解class文件结构,能自己写一个分析工具;分析javap的源代码。  深入学习编译原理,分析javac的源代码。以前分析过一小部分,但不够深入。
       研究多线程编程模型,有几本书重点的看一下,《unix网络编程》,《面向模式的软件体系结构卷2:用于并发和网络化对象的模式》,《PATTERN-ORIENTED SOFTWARE ARCHITECTURE A Pattern Language for Distributed Computing》,《Java Concurrency in Practice》。
       openjdk已经在Ubuntu上构建成功,可以考虑进行一些跟踪和调试分析。

posted @ 2009-03-21 18:28 Zang XT 阅读(109) | 评论 (0)编辑 收藏