MLP with manual mixed precision training

Large Model

# hidden_layer_dims = [5000, 5000, 5000, 5000, 5000, 5000, 5000]
# nx = 1000, ny = 1000
# loss_scale = 1.00003466337
# epochs = 2000

params = 160,036,000

Max Memory Allocation

Training Loss (per epoch)

Loss Scaler

# hidden_layer_dims = [500, 500, 500, 500, 500, 500, 500]
# nx = 1000, ny = 1000
# loss_scale = 1.0003466337
# epochs = 2000

params = 2,504,500