https://github.com/ArturUFJF/VC-Trabalho-Pratico
A estratégia abordada segue uma busca sistemática por hiperparâmetros, partindo de uma configuração base e evoluindo conforme a performance de validação. Sendo o objetivo equilibrar um bom valor para a acurácia final com a eficiência computacional. Os testes a seguir foram feitos usando o tamanho padrão do dataset CIFAR-10 (32x32x3).
todos os experimentos com a DenseNet 121 foram feitas na mesma máquina com o sistema operacional Windows-11-10.0.26100-SP0 com as seguintes configurações de hardware:
| CPU count | 6 |
|---|---|
| Logical CPU count | 12 |
| GPU count | 1 |
| GPU type | NVIDIA GeForce RTX 3060 |
O ponto de partida para o experimento utiliza os seguintes valores de hiperparâmetros abaixo.
| Hiperparâmetros | Valores |
|---|---|
| Epochs | 15 |
| Batch | 64 |
| Learning Rate | $1e-3$ |
| Camadas descongeladas | 0 |
Diferente de uma busca isolada, os parâmetros de camadas descongeladas e taxa de aprendizado serão testados em conjunto.
O critério de seleção para esse conjunto será o par que apresentar o menor valor perda durante a validação e não apresentar divergências em seus gráficos.
para isso foram realizados os experimentos densenet121-tl-run de números: 1400, 1602, 1625, 1651, 1709, 1727, 1745, 1808, 1828, 1857, 1922, 1942, 2002, 2022, 2042, 2101.
os valores encontrados em cada experimento podem ser encontrados na tabela baixo: