JVM 的检查点和恢复

Coordinated Restore at Checkpoint (CRaC) 是一个 OpenJDK 项目,它定义了一个新的 Java API,允许您在 HotSpot JVM 上对应用程序进行检查点和恢复。 它基于 CRIU,这是一个在 Linux 上实现检查点/恢复功能的项目。

其原理如下:您像往常一样启动应用程序,但使用支持 CRaC 的 JDK 版本,如 BellSoft Liberica JDK with CRaCAzul Zulu JDK with CRaC。 然后在某个时刻,可能是在执行一些工作负载以通过执行所有常见代码路径来预热 JVM 之后,您可以通过 API 调用、jcmd 命令、HTTP 端点或其他机制触发检查点。

然后,运行中的 JVM 的内存表示(包括其预热状态)被序列化到磁盘,允许在稍后的时间点快速恢复,可能是在具有类似操作系统和 CPU 架构的另一台机器上。 恢复的进程保留了 HotSpot JVM 的所有功能,包括在运行时的进一步 JIT 优化。

基于 Spring Framework 提供的基础,Spring Boot 提供了对应用程序检查点和恢复的支持,并开箱即用地管理了 在有限范围内的套接字、文件和线程池等资源的生命周期。 对于其他依赖项以及可能处理此类资源的应用程序代码,预计会有额外的生命周期管理。

您可以在 Spring Framework JVM Checkpoint Restore 支持文档 中找到有关两种支持模式("正在运行的应用程序的按需检查点/恢复"和"启动时的自动检查点/恢复")的更多详细信息、如何启用检查点和恢复支持以及一些指南。