Segue vídeo com funcionamento do projeto:
Os arquivos gerados pelo código ficam na pasta “downloads” do GitHub, podendo ser acessados pelo link abaixo:
Os dados foram salvos no banco de dados PostgreSQL. A partir disso, na ferramenta “Query Tool Workspace”, foi utilizado o comando “SELECT * FROM cisternas_municipios” para apresentar a tabela “cisternas_municipios” que foi criada dentro do banco de dados “cisternas”.
Para executar o código Python "baixar_csv_firefox.py", é necessário modificar o arquivo ".env", onde tem "sua_senha_aqui", colocando a sua senha real do banco de dados PostgreSQL.
DB_USER=postgres
DB_PASSWORD= "sua_senha_aqui"
DB_HOST=localhost
DB_PORT=5432
DB_NAME=cisternas
Os novos links diretos para as tabelas de município são:
Página Consumo
Página Produção
Página Escolar
No código do arquivo "baixar_csv_firefox.py", na linha 84, com o comando "time.sleep(20)", o valor "20" pode ser alterado para um valor menor ou maior dependendo da taxa de transmissão da internet. Pois, esse tempo é para aguardar o download do último arquivo ".csv".
def main():
download_dir = preparar_diretorio_download()
driver = configurar_driver(download_dir)
arquivos_baixados = {}
for nome, dados in urls.items():
arquivo = baixar_csv(driver, dados["link"], download_dir, dados["aceitar_lgpd"])
arquivos_baixados[nome] = arquivo
print(f"Arquivo baixado ({nome}): {arquivo}")
time.sleep(20)
driver.quit()
return download_dir, arquivos_baixados
Na função de armazenamento no banco de dados, foi modificado o formato da coluna "Mês/Ano" de "07/2024" para "2024-07-01", de forma que seja possível realizar filtros e ordenações pelas datas, pois foi feito um teste de filtros no banco de dados, com "Where" e "Between", e foi visto que o filtro não foi realizado corretamente.