一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM)

这篇具有很好参考价值的文章主要介绍了一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. JVM 概述

JVMJava Virtual Machine,也就是 Java 虚拟机

所谓虚拟机是指:通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的计算机系统。

即:虚拟机是一个计算机系统。这种计算机系统运行在完全隔离的环境中,且它的硬件系统功能是通过软件模拟出来的。

JVM 通过软件来模拟 Java 字节码的指令集,是 Java 程序的运行环境。

1.1 JVM 的主要功能

JVM 的主要功能包括:

  1. 通过 ClassLoader 寻找和装载 class 文件;
  2. 解释字节码成为指令,并执行,同时提供 class 文件的运行环境;
  3. 进行运行期间的内存分配和垃圾回收;
  4. 提供与硬件交互的平台。
    一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

1.2 虚拟机是 Java 平台无关的保障

Java 程序只跟 Java 虚拟机相关,跟平台无关。

跟平台相关的是 Java 虚拟机本身。
一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

2. JVM 规范的作用

Java 虚拟机规范为不同的硬件平台提供了一种编译 Java 技术代码的规范。

JVM 规范只是对编译出来的 class 字节码文件进行规范,而并没有对 Java 源文件进行规范。

也就是说 Java 虚拟机只认 class 字节码文件,不认 Java 源文件。

Java 虚拟机不关心 class 字节码文件是怎么来的 ,只关心 class 字节码文件符不符合 JVM 规范。

即使开发语言不是 Java,只要能编译生成符合 JVM 规范的 class 字节码文件,那么这种开发语言也是可以使用的。

Java 虚拟机不仅实现了平台无关,也实现了开发语言无关。
一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

JVM 规范使 Java 软件独立于平台,因为编译是针对作为虚拟机的 “一般机器” 而做。

这个作为虚拟机的 “一般机器” 可以是用软件模拟并运行于各种现存的计算机系统;也可以是用硬件来实现。

JVM 规范只是对 Java 虚拟机的实现提出了一些必须遵循的要求,并没有规定如何去实现 Java 虚拟机。因此,不同厂商实现的 Java 虚拟机可能是不同的。

3. JVM 规范文档的下载获取

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

Java 8 版本的虚拟机在网上有中文版的。

Java 8Java 13 版本的 JVM 规范文档基本上是一样的(在 Java 13 版本中的第 5 章多出了 Module 小节)。

4. JVM 规范中的主要内容

这里介绍 Java SE8 虚拟机规范文档(中文版)中的主要内容:

  1. 字节码指令集(相当于中央处理器 CPU
  2. Class 文件的格式
  3. 数据类型和值
  4. 运行时数据区
  5. 栈帧
  6. 特殊方法
  7. 类库
  8. 异常
  9. 虚拟机的启动、加载、链接和初始化

4.1 字节码指令集

class 字节码指令集的相关内容可参考 《Java 虚拟机规范 Java SE 8 版》 中的第 2.11 节、第 6 章、第 7 章。
一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

详见 5. 字节码指令集

4.2 Class 文件的格式

参考 《Java 虚拟机规范 Java SE 8 版》 中第 4 章内容

详见 8. Class 文件的格式

4.3 数据类型和值

参考 《Java 虚拟机规范 Java SE 8 版》 中第 2.22.32.4 节内容
一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

4.4 运行时数据区

参考 《内存分配》 中的 运行时数据区

4.5 栈帧

参考本文章中的 栈帧

参考 《内存分配》 中的 Java

参考 《字节码执行引擎》 中的 栈帧

4.6 特殊方法

参考 《Java 虚拟机规范 Java SE 8 版》 中第 2.9 节内容

详见 6. 特殊方法

4.7 类库

详见 7. 类库

4.8 异常

参考 《Java 虚拟机规范 Java SE 8 版》 中第 2.10 节内容

4.9 虚拟机的启动、加载、链接和初始化

参考 《类加载、连接和初始化》

5. 字节码指令集

5.1 字节码指令集简介

Java 虚拟机的指令由一个字节长度的、代表着某种特定操作含义的 操作码opcode)以及跟随其后的 0 至多个代表此操作所需参数的 操作数operand)所构成。

虚拟机中许多指令并不包含操作数,只有一个操作码。

我们常说的字节码指令其实就是这里的操作码。

5.2 数据类型与指令集

JVM 根据不同的数据类型提供不同的字节码指令。

如下表所示:

第 1 列的 Txxx 中的 T 相当于泛型参数,
即数据类型不同,T 的取值不同。如:对 byte 类型,Tipush 即为 bipush

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.3 加载和存储指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.4 算术指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.5 类型转换指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.6 对象的创建与操作指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.7 操作数栈管理指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.8 控制转移指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.9 方法调用和返回指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.10 抛出异常相关的指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.11 同步相关的指令

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.12 指令格式表(描述指令的功能,使用方式等)

通过指令格式表对指令进行描述,告诉你如何使用指令,指令格式表如下图所示:

指令格式表中描述了指令的功能,使用方式,注意事项等。

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

上表中,助记符就是字节码指令(助记符是给人看的)。操作码就是字节码指令对应的编码(给机器识别的)。

指令集中的指令都会以上表为模板进行描述。

如何阅读指令格式表

下面举例说明如何阅读指令格式表中对指令的描述。

实际开发中,可以在 《Java 虚拟机规范 Java SE 8 版》 中第 6.5 节中查找具体指令的格式表

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM
一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

5.13 如何用字节码指令集表示 Java 代码

如果对某些字节码指令不知道什么时候用到,可以参数 《Java 虚拟机规范 Java SE 8 版》 中第 3 章的内容,查看字节码指令对应的 Java 代码是什么样的。

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

6. 特殊方法

6.1 <init>

实例初始化方法,通过 JVMinvokespecial 指令 来调用

<init> 方法并不是指 Java 代码中定义的构造方法。

Java 代码中定义的构造方法可以理解成是 JVM 在执行完 <init> 方法,创建了实例对象之后,给程序员提供的一种回调方法。

6.2 <clinit>

类或接口的初始化方法,不包含参数,返回 void

7. 类库

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8. Class 文件的格式

8.1 Class 文件概述

Class 文件是 JVM 的输入;是 JVM 实现平台无关、语言无关的基础。

Java 虚拟机规范中定义了 Class 文件的结构(参考 《Java 虚拟机规范 Java SE 8 版》 中第 4 章内容)。

Class 文件是一组以 8 字节为单位的字节流。文件中的各个数据项目按指定的顺序紧凑排列。

对于占用空间大于 8 字节的数据项,按照高位在前的方式分割成多个 8 字节进行存储。

8.2 Class 文件中的两种类型(无符号数、表)

总的来说,Class 文件中只有两种类型:

  1. 无符号数: 即基本数据类型。以 u1u2u4u8 来代表几个字节的无符号数。

    u1 代表 1 字节的无符号数,…,u8 代表 8 字节的无符号数。

  2. 表: 由多个无符号数和其他表构成的复合数据类型。通常以 “_info” 结尾。

8.3 ClassFile 结构

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.4 查看 Java 源码对应的 Class 字节码文件的三种方式

8.4.1 在 Eclipse 中查看 class 文件

EclipseNavigator 视图中找到 class 文件,打开查看即可。

此方式查看的 class 文件不完整。

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.4.2 通过 javap 命令查看 class 文件

class 文件所在的 bin 目录下执行 “javap -verbose 全路径类名” 查看 class 文件。

此方式查看的 class 文件是完整的。

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

javap 生成的非正式 “虚拟机汇编语言” 的格式:

通过 javap 查看 class 文件时,对于类中成员方法的方法体代码,采用非正式 “虚拟机汇编语言” 进行描述。格式如下:

<index> <opcode> [<operand1> [<operand2> ...]] [<comment>]
其中:
<index> 是指令操作码在 code[] 数组中的索引,code[] 数组以字节形式来存储当前分发的 `Java` 虚拟机代码;
        也可以是相对于方法起始处的字节偏移量
<opcode> 是指令的操作码
<operand> 是操作数
<comment> 是行尾的注释

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

如上图中的 main 方法所示:

对于 0: getstatic   #23   // Field java/lang/System.out:Ljava/io/PrintStream; 
其中:
<index> 就是 0
<opcode> 就是助记符 getstatic(用于获取类的静态字段值)
<operand> 只有一个,就是 #23(表示 Constant Pool 常量池中的编号)
<comment> 就是 // 后面的内容
这条非正式 “虚拟机汇编语言” 的含义就是:将静态字段值 System.out 插入到操作数栈的栈顶
8.4.3 通过 16 进制文件查看工具(如 winhex)查看 class 文件

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

参考 《Java 虚拟机规范 Java SE 8 版》 第 4.1 节内容,结合 ClassFile 结构,对 winhex 中显示的 Hello.class 文件的 16 进制数据分析如下:

1. 最开始的 4 字节(u4)是 magic(魔数),JVM 规范要求固定为 0xCAFEBABE
2. 接下来的 2 字节(u2)是 minor_version(副版本号),即 0x0000,对应十进制 0
3. 接下来的 2 字节(u2)是 major_version(主版本号),即 0x0034,对应十进制 16*3+4 = 52
    因为 JDK 版本为 1.k(k>=2)时,对应的 class 文件版本号范围是 45.0 ~ 44+k.0,所以这里的版本号是 1.8.0(44+8 = 52)
4. 接下来的 2 字节(u2)是 constant_pool_count,表示常量池的大小,即 0x0035,对应十进制 53
    注意:常量池的大小不是指常量池所占的内存字节数,而是指常量池中的成员个数。
    常量池中的成员索引为 [0, constant_pool_count - 1],
    常量池中的 #0 不是一个有效的常量池项,仅用来表示 “不引用任何一个常量池项”。
    也就是说,当 constant_pool_count = 53 时,常量池中有效的常量索引为 #1 ~ #52

8.5 常量池

Java 虚拟机指令不依赖于类、接口、类的实例对象、或数组的运行时布局,而是依赖常量池表中的符号信息。

即通过指令集中的指令来描述 Java 代码时,需要依赖 class 文件中常量池内保存的符号信息。

8.5.1 常量池项在 class 文件中的通用格式

常量池表中的所有的项都具有如下通用格式:

cp_info {
    u1 tag;
    u2 info[];
}

常量池表中,一个 cp_info 表示一个常量池项,ClassFile 结构中的常量池数组就是由多个 cp_info 构成的。

常量池表中,存在多个不同类型的 cp_info(常量池项)。

cp_info 中占 1 字节(u1)的 tag 表示 cp_info 的类型。

tag 不同,cp_info 成员结构(info[])也不同,cp_info 所占的内存大小也不同。

注意:通用格式中的 “u1 info[]” 并不是说 cp_infotag 之后 info 数组只占 1 字节。

u1 info[]” 没有明确的含义,必须根据不同的 tag 值,才能确定 info[] 表示的成员结构和所占的内存大小。

8.5.2 常量池项的类型(tag

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

上图所示的表中给出了 cp_info 常量池项的不同 tag 类型,以及对应的 tag 数值。

8.5.2.1 CONSTANT_Class_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.2 CONSTANT_Fieldref_info 类型
8.5.2.3 CONSTANT_Methodref_info 类型
8.5.2.4 CONSTANT_InterfaceMethodref_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.5 CONSTANT_String_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.6 CONSTANT_Integer_info 类型
8.5.2.7 CONSTANT_Float_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.8 CONSTANT_Long_info 类型
8.5.2.9 CONSTANT_Double_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.10 CONSTANT_NameAndType_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.11 CONSTANT_Utf8_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.12 CONSTANT_MethodHandle_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.13 CONSTANT_MethodType_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.2.14 CONSTANT_InvokeDynamic_info 类型

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.5.3 如何确定 class 文件中常量池的结束位置

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.6 access_flags(访问权限标志)

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.7 this_class、super_class、interfaces

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM
一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.8 字段(成员变量)

每个字段(field)都通过 field_info 结构定义。

8.8.1 字段在 class 文件中的格式
field_info {
    u2              access_flags;
    u2              name_index;
    u2              descriptor_index;
    u2              attributes_count;
    attribute_info  attributes[attributes_count];
}

其中:
access_flags:表示字段的访问权限和基本属性。可以是多个权限和属性的标志的组合(位或运算)。
name_index:是对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Utf8_info,用于表示字段名。
descriptor_index:是对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Utf8_info,用于表示字段描述符。
attributes_count:表示当前字段的附加属性的数量。
attributes[]:表示附加属性表,表中每个附加属性的结构必须是 attribute_info。
字段描述符

字段的描述符(descriptor)是一个用于 描述字段类型 的字符串。

字段描述符不仅可以描述成员变量的类型,还可以描述静态变量和局部变量的类型。

即:字段描述符就是用来描述任意变量的类型的。

参考 《Java 虚拟机规范 Java SE 8 版》 第 4.3.2 节(字段描述符)内容。

// 字段描述符用于描述字段类型
FieldDescriptor:
    FieldType

// 字段类型包括:基本类型、类类型、数组类型
FieldType:
    BaseType
    ObjectType
    ArrayType

// 基本类型就是 byte/char/double/float/int/long/short/boolean 其中之一。
BaseType: one of
    B C D F I J S Z

// 类类型就是 "L + 全路径类名(路径中的 "." 用 "/" 代替) + ;"
ObjectType:
    L<ClassName>;

// 数组类型就是 "[ + 元素类型"
ArrayType:
    [<ComponentType>

// 数组的元素类型就是 字段类型
ComponentType:
    FieldType

字段描述符解释表如下:

FieldType 中的字符 类型 含义
B byte 字节型数
C char 字符型数
D double 双精度浮点数
F float 单精度浮点数
I int 整型数
J long 长整数
L<ClassName> reference ClassName 类的实例
S short 短整数
Z boolean 布尔值 true/false
[ reference 一个一维数组

特别注意:基本类型中,long 的描述符为 Jboolean 的描述符为 Z,其他基本类型的描述符即为大写的首字母。

举例:

int 变量的描述符是:I
Object 类型的实例变量的描述符是:Ljava/lang/Object;
三维数组 double d[][][] 类型的变量的描述符是:[[[D
8.8.2 字段的访问权限和基本属性的标志

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

字段的各个访问标志是可以通过位或运算进行组合的。

private static 修饰的字段就是 ACC_PRIVATEACC_STATIC 的组合,此时 access_flags 的值就是 0x0002 | 0x0008 = 0x000A

8.8.3 字段在 class 文件中的解析举例

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.9 方法(成员方法)

包括实例初始化方法以及类或接口初始化方法在内的所有方法(method),都通过 method_info 结构来定义。

8.9.1 方法在 class 文件中的格式
method_info {
    u2              access_flags;
    u2              name_index;
    u2              descriptor_index;
    u2              attributes_count;
    attribute_info  attributes[attributes_count];
}

其中:
access_flags:表示方法的访问权限和基本属性。可以是多个权限和属性的标志的组合(位或运算)。
name_index:是对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Utf8_info,用于表示方法名。
descriptor_index:是对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Utf8_info,用于表示方法描述符。
attributes_count:表示当前方法的附加属性的数量。
attributes[]:表示附加属性表,表中每个附加属性的结构必须是 attribute_info。
方法描述符

方法描述符(descriptor)是一个用于 描述参数类型和返回值类型 的字符串。

无论某方法是静态方法还是实例方法,其方法描述符都是相同的。

也就是说无法通过一个方法的方法描述符来判断该方法是静态的还是非静态的。

尽管实例方法除了传递自身定义的参数外,还需要额外传递参数 this,但是这一点不是由方法描述符来表达的。

参数 this 的传递是由 Java 虚拟机中调用实例方法时所使用的字节码指令来实现的。

参考 《Java 虚拟机规范 Java SE 8 版》 第 4.3.3 节(方法描述符)内容。

// 方法描述符由参数描述符列表和返回值描述符组成
MethodDescriptor:
    ({ParameterDescriptor})ReturnDescriptor

// 参数描述符就是 字段类型
ParameterDescriptor:
    FieldType

// 返回值描述符包括: 字段类型、void 描述符
ReturnDescriptor:
    FieldType
    VoidDescriptor

// void 描述符就是 V,表示方法不返回任何值(即方法的返回值类型是 void)
VoidDescriptor:
    V

举例:

Object foo(int i, double d, Thread t) {...} 方法的描述符是:(IDLjava/lang/Thread;)Ljava/lang/Object;
void foo() {...} 方法的描述符是:()V
8.9.2 方法在 class 文件中的解析举例

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.10 属性(attribute)

属性(attribute)在 class 文件中的 ClassFile 结构、field_info 结构、method_info 结构和 Code_attribute 结构中都有使用。

8.10.1 属性在 class 文件中的通用格式
attribute_info {
    u2 attribute_name_index;
    u4 attribute_length;
    u1 info[attribute_length];
}

其中:
attribute_name_index:是对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Utf8_info,用于表示属性名。
attribute_length:给出了 info[] 数组所占的字节大小。
info[]:不同属性的 info[] 不同,参考各个属性的具体格式。
8.10.2 JVM 规范中预定义的属性(23 个)

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.10.3 Code 属性

Code 属性附加方法的附加属性出现在 method_info 结构中。

Code 属性中包含方法(如成员方法、实例初始化方法、类或接口初始化方法)的 Java 虚拟机指令,及相关的辅助信息。

对于抽象方法(abstract 修饰的方法)、本地方法(native 修饰的方法),方法对应的 method_info 结构中不能有 Code 属性。

nativeabstract 方法之外的其他方法的 method_info 中则必须有,且只能有一个 Code 属性。

8.10.3.1 Code 属性的格式
Code_attribute {
    u2             attribute_name_index;
    u4             attribute_length;
    u2             max_stack;
    u2             max_locals;
    u4             code_length;
    u1             code[code_length];
    u2             exception_table_length;

    {
        u2 start_pc;
        u2 end_pc;
        u2 handler_pc;
        u2 catch_type;
    } exception_table[exception_table_length];

    u2             attributes_count;
    attribute_info attributes[attributes_count];
}

其中:
attribute_name_index:是对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Utf8_info,固定为属性名 `Code`。
attribute_length:表示从 max_stack 到 attribute_info_attributes[] 所占的字节大小。即当前 Code 属性在 class 文件中的剩余长度。
max_stack:表示当前方法在调用时,其栈帧中的操作数栈的最大深度。
max_locals:表示当前方法在调用时,其栈帧中的局部变量表内,有多少个局部变量(包括用于传递参数的局部变量)。
code_length:表示 code[] 数组所占的字节大小。(code_length 的值必须大于 0 ,即 code[] 数组不能为空)
code[]:用于保存实现当前方法的 `Java` 虚拟机代码。
exception_table_length:表示 exception_table[] 数组中的元素个数。

exception_table[]:该数组中的一个元素代表 code[] 数组中的一个异常处理器。
exception_table[] 数组中的每个元素都包含如下结构:
    start_pc 和 end_pc:当前元素代表的异常处理器在 code[] 中的有效范围是 [start_pc, end_pc]。
                        start_pc 的值表示对 code[] 中某一指令操作码的有效索引;
                        end_pc 的值要么是对 code[] 中某一指令操作码的有效索引,要么等于 code_length;
                        start_pc 必须小于 end_pc。
                        当程序计数器在范围 [start_pc, end_pc] 内时,当前元素表示的异常处理器就将生效。
    handler_pc:当前元素代表的异常处理器的起点,handler_pc 的值表示对 code[] 中某一指令操作码的有效索引。
    catch_type:若值不为 0,
                    则表示对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Class_info,
                    表示当前元素代表的异常处理器需要捕捉的异常类型。
                若值为 0,
                    则表示当任意异常抛出时,都会调用当前元素代表的异常处理器。
                    这可用于实现 finally 语句。

attributes_count:表示 attributes[] 数组中的元素个数。
attributes[]:表示与 Code 属性相关联的其他附加属性的集合。
              该数组(属性表)中的每个元素都必须是 attribute_info 类型的。

Code 属性相关联的附加属性(即 attributes[] 属性表中的属性类型)可以是:

  1. LineNumberTable
  2. LocalVariableTable
  3. LocalVariableTypeTable
  4. StackMapTable
  5. RuntimeVisibleTypeAnnotationsRuntimeInvisisbleTypeAnnotations
8.10.3.2 LineNumberTable
该属性用于确定 Java 源码与 code[] 中的 `Java` 虚拟机代码之间的对应关系。
LineNumberTable 属性中保存了一个 line_number_table[] 数组,该数组元素的结构为:
    {
        u2 start_pc;
        u2 line_number;
    }
通过数组元素可以表明:
    Java 源文件中行号为 line_number 处的源码,会在 code[] 数组中索引 start_pc 处的指令中发生变化。
8.10.3.3 LocalVariableTable
在方法调用时,通过该属性来确定某个局部变量的值。
LocalVariableTable 属性中保存了一个 local_variable_table[] 数组。一个数组元素表示一个局部变量。
该数组元素的结构为:
    {
        u2 start_pc;
        u2 length;
        u2 name_index;
        u2 descriptor_index;
        u2 index;
    }
    其中:
    start_pc 和 length:start_pc 必须是对 code[] 中某一指令操作码的有效索引;
                        start_pc + length 要么是对 code[] 中某一指令操作码的有效索引,
                                要么是刚超过 code[] 数组末尾的首个索引值。
                        当程序执行到 code[] 数组的 [start_pc, start_pc+length] 范围内时,
                        该局部变量是有效的(即该局部变量必定有值存在)。
    name_index:是对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Utf8_info,
                表示该局部变量名。
    descriptor_index:是对常量池表的一个有效索引,该索引指向的常量池项的类型为 CONSTANT_Utf8_info,
                      表示该局部变量的字段描述符(即局部变量的类型)。
    index:表示在方法调用时,该局部变量在栈帧的局部变量表中的索引。
            如果栈帧的局部变量表中,index 索引处的局部变量是 long 或 double 类型,则占用 index 和 index+1 两个位置。
8.10.3.4 LocalVariableTypeTable
当局部变量的类型中包含泛型(如 T 或 List<T> 类型的局部变量),或泛型的具体类型(如 List<String> 类型的局部变量)时,
这种类型的局部变量不仅会出现在 LocalVariableTable 属性中,还会出现在 LocalVariableTypeTable 属性中。

LocalVariableTypeTable 属性中保存了一个 local_variable_type_table[] 数组。一个数组元素表示一个局部变量。
该数组元素的结构为:
    {
        u2 start_pc;
        u2 length;
        u2 name_index;
        u2 signature_index;
        u2 index;
    }

与 LocalVariableTable 属性中的 local_variable_table[] 数组元素的唯一区别在于:
    local_variable_table[] 数组元素中使用 descriptor_index 指定的字段描述符来表示局部变量的类型;
    local_variable_type_table[] 数组元素中使用 signature_index 指定的字段签名来表示局部变量的类型;

注意:字段描述符 和 字段签名 是存在区别的。

字段签名参考 《Java 虚拟机规范 Java SE 8 版》 中第 4.7.9 节内容(Signature 属性)

8.10.3.5 StackMapTable
该属性用在虚拟机的类型检查验证阶段。
一个方法只能有 0 个或 1 个 StackMapTable 属性。
StackMapTable 属性中保存了一个 stack_map_frame[] 数组,其中 stack_map_frame 表示栈映射帧。
栈映射帧 stack_map_frame 指定了 code[] 中某一指令对应的局部变量和操作数栈的类型。
通过 StackMapTable 属性中保存的栈映射帧集合(stack_map_frame[]),可以提高 JVM 在类型检查的验证阶段的效率。
8.10.3.6 RuntimeVisibleTypeAnnotationsRuntimeInvisisbleTypeAnnotations

RuntimeVisibleTypeAnnotations 属性中保存了运行时可见的注解集合

RuntimeVisibleTypeAnnotations 属性中保存了运行时不可见的注解集合

8.10.3.7 栈帧

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.10.3.8 局部变量表(local variable 又称本地变量表)

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

8.10.3.9 Code 属性在 class 文件中的解析举例(Slot 可复用)

参考 《字节码执行引擎》 中的 局部变量表

一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

注意:方法调用时,栈帧中的局部变量表中的局部变量所占的内存空间是可以复用的。

也就是说,LocalVariableTable 属性中保存的局部变量在局部变量表中的索引 index 可能跟其他局部变量的索引相同。如下图所示:
一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM),JVM,jvm,Java,Class字节码,ASM

上图中,
locals=2,即局部变量在局部变量表中总共占 2 slot 单位的内存空间。
根据 LocalVariableTable 属性中的内容可知,局部变量表中保存了 3 个局部变量,
其中两个局部变量的索引是相同的(即局部变量 test 和 e 的索引相同,都为 1),
也就是说,局部变量 test 和 e 共用了 1 slot 单位的内存空间。

9. ASM 开发

ASM 是一个 Java 字节码操控框架。通过 ASM 可以动态生成类或者增强既有类的功能。

ASM 可以直接生成 class 文件,也可以在 class 文件被加载到 Java 虚拟机之前,修改 class 文件中的内容,从而 动态改变类行为。

class 文件中保存的二进制数据足够用来解析所有与 Java 类相关的信息:类名称、继承关系、成员变量、成员方法、以及方法体中的 Java 代码。

简单的说,ASM 可以读取并解析 class 文件的内容,并提供接口对 class 文件的内容进行访问和修改。

目前许多框架如 CGLibHibernateSpring 都直接或间接地使用 ASM 操作字节码。

使用 ASM 需要导入依赖包:asm-7.3.1.jarasm-util-7.3.1.jar

9.1 编程模型和核心 API

ASM 提供了两种编程模型:

  1. Core API

    提供了基于事件形式的编程模型。
    该模型不需要一次性地将整个类的结构读取到内存中。
    因此这种方式更快,需要的内存更少。
    但这种编程方式难度较大。
    
  2. Tree API

    提供了基于树形的编程模型。
    该模型需要一次性地将整个类的结构读取到内存中。
    因此这种方式需要的内存更多。
    但这种编程方式较为简单。
    

9.2 ClassVisitor 开发

ClassVisitorCore API 编程模型中提供的接口,用于对字节码进行操作。

ClassVisitor 接口中的每个方法对应了 class 文件中的每一项。

ASM 提供了三个基于 ClassVisitor 接口的实现类来完成 class 文件的生成和转换。

  1. ClassReader:用于解析一个类的 class 文件。
  2. ClassAdapter:实现会变化的功能。
  3. ClassWriter:用来输出变化后的字节码。

ASM 给我们提供了 ASMifier 工具来帮助开发,可使用 ASMifier 工具生成 ASM 结构来对比。文章来源地址https://www.toymoban.com/news/detail-817708.html

9.3 MethodVisitor 开发

9.4 实现模拟 AOP 功能

到了这里,关于一、认识 JVM 规范(JVM 概述、字节码指令集、Class文件解析、ASM)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • JVM-透彻理解字节码以及指令

    一、字节码与指令概述 生成字节码: 解释:         cafe babe -  魔数         0000 0031 - 版本号,前面大版本,后面小版本         0022 - 常量池大小 二、JVM编译基本原理 示例: 大白话:         符号解析: int x = 5 -  int 类型的字段 x值为5 以及作用域 大白话:        

    2024年01月22日
    浏览(45)
  • 深入理解JVM虚拟机第二十七篇:详解JVM当中InvokeDynamic字节码指令,Java是动态类型语言么?

     😉😉 学习交流群: ✅✅1:这是孙哥suns给大家的福利! ✨✨ 2:我们免费分享Netty、Dubbo、k8s、Mybatis、Spring...应用和源码级别的视频资料 🥭🥭3:QQ群: 583783824   📚📚  工作微信: BigTreeJava 拉你进微信群,免费领取! 🍎🍎4:本文章内容出自上述:Spring应用课程!💞💞

    2024年02月04日
    浏览(46)
  • “深入解析JVM内部机制:从字节码到垃圾回收“

    标题:深入解析JVM内部机制:从字节码到垃圾回收 摘要:JVM(Java虚拟机)是Java程序的运行环境,它负责将Java字节码转换为机器指令并执行。本文将深入探讨JVM的内部机制,从字节码的加载、解析和执行到垃圾回收的原理和实现方式。 字节码加载和解析 在Java程序运行之前,

    2024年02月14日
    浏览(37)
  • JVM(字节码文件详解)

    类加载器 运行时数据区域 执行引擎(主要理解垃圾回收器,及时编译器) 本地方法 在讲解字节码文件组成前,可以安装使用“ jclasslib ”工具或idea中“ jclasslib ”插件进行字节码文件查看 jclasslib的Github地址: https://github.com/ingokegel/jclasslib

    2024年01月23日
    浏览(65)
  • 【JVM】字节码文件的组成

    1. 魔数与Class文件版本  魔数是一个用于校验字节码文件是否有效的标识,位于文件开头的前四个字节,魔数之后是次版本号和主版本号,共同构成了字节码文件的版本号。 2.常量池 常量池是字节码文件中的一个结构,包含了该类的所有常量,如数字,字符串,符号常量等。

    2024年02月02日
    浏览(47)
  • JVM系列-2.字节码文件详解

    👏作者简介:大家好,我是爱吃芝士的土豆倪,24届校招生Java选手,很高兴认识大家 📕系列专栏:Spring原理、JUC原理、Kafka原理、分布式技术原理、数据库技术、JVM原理 🔥如果感觉博主的文章还不错的话,请👍三连支持👍一下博主哦 🍂博主正在努力完成2023计划中:源码

    2024年01月22日
    浏览(40)
  • 【JVM】字节码文件的组成部分

    🐌个人主页: 🐌 叶落闲庭 💨我的专栏:💨 c语言 数据结构 javaEE 操作系统 Redis 石可破也,而不可夺坚;丹可磨也,而不可夺赤。 操作数栈是临时存放数据的地方 局部变量表是存放方法中的局部变量的位置 观察如下代码的字节码文件 具体的java源代码: 要想看到java的字

    2024年02月08日
    浏览(42)
  • JVM——类加载与字节码技术—类文件结构

      由源文件被编译成字节码文件,然后经过类加载器进行类加载,了解类加载的各个阶段,了解有哪些类加载器,加载到虚拟机中执行字节码指令,执行时使用解释器进行解释执行,解释时对热点代码进行运行期的编译处理。    根据下面规范,魔数,两个版本,常量池信息

    2024年02月11日
    浏览(39)
  • 什么时候会触发FullGC?描述一下JVM加载class文件的原理机制?

    什么时候会触发 FullGC? 除直接调用 System.gc 外,触发 Full GC 执行的情况有如下四种。 1. 旧生代空间不足 旧生代空间只有 在新生代对象转入及创建为大对象、大数组时才会出现不足的现象,当执行 Full GC 后空间仍然不 足,则抛出如下错误: java.lang.OutOfMemoryError: Java heap spac

    2024年02月20日
    浏览(46)
  • class文件中,常量池之后的相关数据解析!【class二进制文件分析】

    前言:前段时间读《深入java虚拟机》介绍到class文件的时候,由于理论知识较多,人总感觉疲惫不堪,就泛泛阅读了一下。在工作中使用起来知识点知道,但是总是需要查阅各种资料。今天有时间,继续整理常量池后面的相关知识。 class文件中,我们可以通过背或记也好,或

    2024年02月07日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包