类加载的过程
类的生命周期是由7个阶段组成,但是类的加载说的是前5个阶段
加载
1、通过类的全限定名获取存储该类的class文件(没有指明必须从哪获取)
2、解析成运行时数据,即instanceKlass实例,存放在方法区
3、在堆区生成该类的Class对象,即instanceMirrorKlass实例
就是说你可以改写openjdk源码,你写的程序能达到这三个效果即可
JVM 是懒加载模式 lazy loading
何时加载?
主动使用时:
1、new、getstatic、putstatic、invokestatic
2、反射
3、初始化一个类的子类会去加载其父类
4、启动类(main函数所在类)
5、当使用jdk1.7动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果是REF_getstatic,REF_putstatic,REF_invokeStatic的方法句柄,并且这个方法句柄所对应的类没有进行初始化,则需要先出触发其初始化
预加载:包装类、String、Thread
从哪加载?
因为没有指明必须从哪获取class文件,脑洞大开的工程师们开发了这些
1、从压缩包中读取,如jar、war
2、从网络中获取,如Web Applet
3、动态生成,如动态代理、CGLIB
4、由其他文件生成,如JSP
5、从数据库读取
6、从加密文件中读取
验证
1、文件格式验证
2、元数据验证
3、字节码验证
4、符号引用验证
准备
为静态变量分配内存、赋初值
实例变量是在创建对象的时候完成赋值的,没有赋初值一说
如果被final修饰,在编译的时候会给属性添加ConstantValue属性,准备阶段直接完成赋值,即没有赋初值这一步。
如何证明?使用jclasslib查看字节码信息
解析
将常量池中的符号引用转为直接引用
解析后的信息存储在ConstantPoolCache类实例中
1、类或接口的解析
2、字段解析
3、方法解析
4、接口方法解析
何时解析?
思路:
1、加载阶段解析常量池时
2、用的时候
openjdk是第二种思路,在执行特定的字节码指令之前进行解析:
anewarray、checkcast、getfield、getstatic、instanceof、invokedynamic、invokeinterface、invokespecial、invokestatic、invokevirtual、ldc、ldc_w、ldc2_w、multianewarray、new、putfield
解析阶段 间接引用 转 直接引用
间接引用:指向运行时常量池的引用
直接引用:就是内存地址
常量池:
class文件的常量池(静态常量池)
运行时常量池(HSDB看到的)
字符串常量池 StringTable
证明符号引用(间接引用) 转 直接引用:
public class Test_1 {
private final static int a = 10;
private static int b = 11;
private int c = 12;
public static void main(String[] args) {
int[] arr = new int[1];
Test_1[] arr2 = new Test_1[1];
while (true) ;
}
}
运行前通过javap -verbose查看Java字节码文件:
使用javap -verbose 命令 需要切换到在classes目录下 ,在其他目录下执行会有问题
执行 javap -verbose 类的全限定名 查询字节码信息
可以看到Class指向的是 #36,#36是在常量池中,#36 又指向Test_1这个类。这就叫做符号引用。
符号引用:就是指向常量池的引用
运行后:
运行上面的代码,通过jps 查找进程ID ,Test_1 = 17384
启动HSDB,查看JVM字节码文件
运行后,类被解析,有真实的内存地址,值就不在指向常量池而是指向内存地址
可以看到Class的值不在指向常量池而是指向 Test_1的内存地址。这就是直接引用
直接引用:就是指向内存地址
初始化
执行静态代码块,完成静态变量的赋值
静态字段、静态代码段,字节码层面会生成clinit方法
方法中语句的先后顺序与代码的编写顺序相关
1.执行静态代码块,会自动生成一个clinit
2.定义一个static属性,JVM也会自动生成一个clinit
3.生成的clinit方法,代码顺序跟定义的顺序保持一致的
读取静态变量的底层实现
jdk8中,静态属性是存储在镜像类instanceMirrorKlass中的而不是instanceKlass
jdk6中,静态属性是存储在instanceKlass
public class Test_1 {
public static void main(String[] args) {
System.out.printf(Test_1_B.str);
while (true);
}
}
class Test_1_A {
public static String str = "A str";
static {
System.out.println("A Static Block");
}
}
class Test_1_B extends Test_1_A {
static {
System.out.println("B Static Block");
}
}
静态属性如何存储的?
使用HSDB 工具查看字节码文件:
在jdk8中,静态属性是存储在镜像类instanceMirrorKlass中的而不是instanceKlass
Test_1_A:
静态变量str的值存放在StringTable中,镜像类中存放的是字符串的指针
klass:类
oop klass:类的内存地址
Test_1_B:
str是类Test_1_A的静态属性,可以看到不会存储到子类Test_1_B的镜像类中
可以猜得到,通过子类Test_1_B访问父类Test_1_A的静态字段有两种实现方式:
1、先去Test_1_B的镜像类中去取,如果有直接返回;如果没有,会沿着继承链将请求往上抛。很明显,这种算法的性能随继承链的depth而上升,算法复杂度为O(n)
2、借助另外的数据结构实现,使用K-V的格式存储,查询性能为O(1)
Hotspot就是使用的第二种方式,借助另外的数据结构ConstantPoolCache,常量池类ConstantPool中有个属性_cache指向了这个结构。每一条数据对应一个类ConstantPoolCacheEntry
ConstantPoolCacheEntry在哪呢?
在ConstantPoolCache对象后面,看代码
\openjdk\hotspot\src\share\vm\oops\cpCache.hpp
ConstantPoolCacheEntry* base() const {
return (ConstantPoolCacheEntry*)((address)this + in_bytes(base_offset()));
}
// 这个公式的意思是ConstantPoolCache对象的地址加上ConstantPoolCache对象的内存大小
ConstantPoolCache
常量池缓存是为常量池预留的运行时数据结构。保存所有字段访问和调用字节码的解释器运行时信息。缓存是在类被积极使用之前创建和初始化的。每个缓存项在解析时被填充
ConstantPoolCache主要用于存储某些字节码指令所需的解析(resolve)好的常量项,例如给[get | put]static、[get | put]field、invoke[static | special | virtual | interface | dynamic]等指令对应的常量池使用。 |
如何读取?
\openjdk\hotspot\src\share\vm\interpreter\bytecodeInterpreter.cpp
CASE(_getstatic):
{
u2 index;
ConstantPoolCacheEntry* cache;
index = Bytes::get_native_u2(pc+1);
// QQQ Need to make this as inlined as possible. Probably need to
// split all the bytecode cases out so c++ compiler has a chance
// for constant prop to fold everything possible away.
cache = cp->entry_at(index);
if (!cache->is_resolved((Bytecodes::Code)opcode)) {
CALL_VM(InterpreterRuntime::resolve_get_put(THREAD, (Bytecodes::Code)opcode),
handle_exception);
cache = cp->entry_at(index);
}
……
从代码中可以看出,是直接去获取ConstantPoolCacheEntry