YARN可以通过相关配置支持ResourceManager重启过程中,不影响正在运行的作业,即重启后,作业还能正常继续运行直到结束。
参见详细文档 ResourceManagerRestart
涉及配置如下:
备注:
yarn.resourcemanager.store.class
**配置的存储介质中,重启后会load这些信息,并且NodeManger会将还在运行的container信息同步到ResourceManager,整个过程不影响作业的正常运行。yarn.resourcemanager.store.class
**支持三种存储介质的配置(HA集群只支持ZKRMStateStore),选择不同的介质,还需要增加相关配置,详见ResourceManagerRestart修改 yarn-site.xml
未开启Recovery
若集群**未开启
**Recovery功能,则重启ResourceManager的过程中:
重启后UI页面作业信息消失