五十五、Java虚拟机的内存布局

04_jvm_05_memory_layout

第五十一章 Java虚拟机的内存布局

1 概述

当Java虚拟机运行时，所有的数据都是放在内存中的。这些数据包括程序创建出来的对象和支持Java虚拟机运行的数据。虽然，Java虚拟机的标准文档并未规定对象如何管理，Java虚拟机各组件之间如何协调工作，但是，绝大部分Java虚拟机的实现都会按照如下的方式组织和管理内存数据。因此，本章将详细介绍这种内存管理方法。请注意，如果读者在阅读Java虚拟机某个版本的具体实现时，发现与本文描述的存在差异的话，这个是正常的，毕竟Java虚拟机标准并未给出任何限制，各大厂商有足够的自由去选择实现的方法。

2 内存布局(Memory Layout)

总的来说，Java虚拟机的内存可大致分为三类：堆区域(Heap Area)、非堆区域(Non-Heap Area)和用于其他用途的区域。

堆区域(Heap Area)存放着在Java虚拟机运行时动态创建的数据，例如：Java虚拟机创建的对象实例，应用程序创建的对象实例等。堆区域是在Java虚拟机启动时创建出来的。它的大小可随着需要增长或缩小。在Java虚拟机启动时，堆的大小由参数-Xms决定，堆的最大大小由参数-Xmx决定。
非堆区域(Non-Heap Area)是在Java虚拟机启动时创建的，用于保存不常变化的数据，例如：类的常量池，类的代码数据，字符串等。常见的Permanent Generation数据，或者Metaspace区域（从Java 8起，Permanent Generation由Metaspace取代）就属于非堆区域。从名字上可以看出，Permanent Generation或者Metaspace是用于存放应用程序的元数据，这些数据在程序运行的过程中不会变化。方法区域(Method Area)也是属于非堆区域，也是一种应用程序的元数据。方法区域用于存放应用程序的代码。非堆区域的大小可由参数-XX:MaxPermSize决定。
其他区域包含了Java虚拟机自身使用的数据，代码，JIT编译器生成的机器代码，和一些缓存数据等。

我们下面将会详解介绍堆区域的内存管理，因为堆区域的内存管理是与垃圾回收器紧密相连的。它的管理方式直接影响着应用程序运行的效率。我们将在下一章详细介绍Java虚拟机的垃圾回收机制。

3 堆区域内存管理

Java虚拟机将堆区域分为两个子区域：新生代区域(Nursery或者Young Generation Area)和老年代区域(Old Generation Area)。这样的划分方法是为了优化Java垃圾回收机制而制定的。众所周知，Java不需要开发人员释放使用完毕的对象，对象回收是由垃圾回收器自动完成的。当垃圾回收器运行时，它会扫描部分或者全部的对象，并释放那些未被引用的对象。当垃圾回收器运行时，Java虚拟机会暂定Java程序的运行。因此，垃圾回收器运行的速度将直接影响Java程序的运行。

为了优化Java垃圾回收过程，Java的开发者们对Java程序进行了长年累月的分析与研究。他们发现绝大部分的Java对象可被分为两类。一类是“瞬时”对象，即对象刚被创建不久，经短时间运行之后就可以被释放了。另一类是“持久型”对象，即对象被创建后，会长时间的处于使用状态。根据这个观察结果，Java虚拟机采用了以存活时间长短为依据来区分和管理对象的方式。

如图一所示，新生代区域存放新创建的对象。新生代区域包括Eden区域、S0和S1区域。所有新创建的对象会被放入Eden区。经过一段时间后，仍然存活的对象会被移入S0或者S1区。S0和S1是对等的、相同功能的区域。其用处是，如果目前所有对象都在S0区的话，经垃圾回收器扫面后，所有存活的对象会被移入S1区。此时S0区被清空。然后，当下一轮扫面过后，所有存活的对象会从S1区移入S0区；S1区被清空。如此往复。当对象的存活时间超过一个阈值(Threshold)时，会被移入老年代区(Old Generation Area)。这种实现方法是下一章将要介绍的Sweep-and-Copying策略。

Java虚拟机会对新生代区域和老年代区域分别应用不同的垃圾回收策略。我们将在下一章详细介绍。

图一 Java虚拟机堆区域内存布局

图一 Java虚拟机堆区域内存布局。

4 Java的堆与栈

在介绍完堆区域之后，我们再来比较一下Java虚拟机使用的堆和栈。堆和栈是程序设计中常被提及的两个概念。一般的，堆用于分配动态内存，而栈用于保存函数调用的状态。但是，在Java虚拟机中，情况略复杂一些。

Java虚拟机本身是一个程序，因此，它本身是依赖于堆和栈运行的。与此同时，Java虚拟机解释运行Java的程序。为了运行Java程序，Java虚拟机还为其准备了堆和栈。这个堆就是我们上述的堆空间，而栈则保存了Java程序函数调用的状态。

准确的说，Java程序的堆和栈并不是对等的两个概念。每个Java虚拟机只为Java程序准备一个堆区域；然而，Java虚拟机会为每个Java程序的线程创建一个调用栈。因此，一个Java程序只有一个堆，但是可能有多个栈。

图二显示的是下面程序运行于第8行的调用栈状态和堆内存布局。程序开始于main()函数，然后调用init()方法，最后调用createInteger()方法，停在了第8行。因此，在图二中，最左侧的方框自下而上地显示了函数调用的顺序。然而，在Java虚拟机中，方法调用的顺序是保存在调用栈上的。在栈上，每个函数使用的区域被称为一个Frame，所以，根据Frame的顺序就能推出函数调用的顺序。而且，在每个Frame中，还保存了方法定义的临时变量。基本数据类型的临时变量和对象引用都存放在栈中。例如：createInteger()方法定义的临时变量i和j，和main()函数定义的对象引用example。而在程序运行的过程中，动态创建出来的(使用关键字new创建出来的)对象则存放在堆区域中。所以，CallStackExample()对象是存放在堆区域的。这个规则有一个例外，因为Java虚拟机对String对象做了特殊处理，所以，所有在程序中定义的String对象都是存放在常量池中的。因为从命令行输入的参数是一个字符串数组，所有的数组都是存放在堆区域的。

图二 Java虚拟机的堆和栈

图二 Java虚拟机的堆和栈。

public class CallStackExample {
    private Integer pid = null;
    public void init() {
        this.pid = createInteger();
    }
    public Integer createInteger() {
        int i = 2;
        int j = 3;
        return Integer.of(i * j); // 假设程序运行后，暂停在这一行
    }
    public static void main(String[] args) {
        CallStackExample example = new CallStackExample();
        example.init();
    }
}

如果读者想进一步了解Java程序中调用栈的工作原理，可查看我们的OnlineTutor在线程序。

5 总结

本章讲解了Java虚拟机中内存的分布、以及比较了Java程序中堆与栈的联系与区别。我们将在下一章介绍与内存管理息息相关的垃圾回收机制。

注册用户登陆后可留言