1. NvLink 不能用

  2. 磁盘分区

  3. RAID 0

    # 1. 安装 mdadm
    sudo apt update
    sudo apt install -y mdadm
    
    # 2. 创建 RAID0
    sudo mdadm --create --verbose /dev/md0 --level=0 --raid-devices=4 /dev/nvme[0-3]n1
    cat /proc/mdstat
    
    sudo mdadm --detail --scan | sudo tee -a /etc/mdadm/mdadm.conf
    sudo update-initramfs -u
    
    # 3. 保存配置(防止重启丢阵列)
    sudo mdadm --detail --scan | sudo tee -a /etc/mdadm/mdadm.conf
    sudo update-initramfs -u
    
    4. 格式化阵列
    sudo mkfs.ext4 -L scratch /dev/md0
    
    
  4. 设置GPU 功率上限

for i in 0 1 2 3 4 5 6 7; do sudo nvidia-smi -i $i -pl 320; done

  1. BMC 控制面板

    MAC D8:5E:D3:E6:99:A2

    admin 123456 192.168.100.2

    与网卡2 连接

    首先通过ssh 转发端口

    ssh -N -L 8443:192.168.100.2:443 maintain@222.20.76.74