系统

Slurm + OOD

OOD 进一步部署

用户同步

账户配额、监控与报表

EPIC 集群|计算节点 SSH 绕过防护方案(暂缓实施-预案文档)

Control Node Migration

Ansible

新增计算节点

硬盘配额

Gres 配额

docker

NFS

IAPP 文件逻辑

设置资源分配


维护入口

利用率处理

节点掉线恢复

应对网络断联导致的节点失效