TEMA: Previsão de Inadimplência

INTEGRANTES: Gabriel da Cunha Teixeira, Micael Ferrari, Matheus Werneck, Pedro Henrique Marazo, Thiago Malaquias

LINK GITHUB: https://github.com/Micaelferrari/aprendizado-supervisionado

LINK NOTION (Relatório): https://www.notion.so/RELAT-RIO-FINAL-21564dc8807880b69b95c6bb87b6cee8?source=copy_link

Introdução ao problema

O projeto tem como objetivo prever a inadimplência de clientes com base em características financeiras e comportamentais. No entanto a variável de interesse foi o “default payment next month”, que indica se um cliente irá se tornar inadimplente ou não no próximo mês. Trata-se, portanto, de um problema de classificação binária em um contexto de crédito e risco financeiro.

A motivação da modelagem, se deve ao fato do possível auxilio a instituições financeiras na tomada de decisão sobre a disponibilização de crédito, com o intuito de prever comportamentos futuros baseados nos dados históricos.

Descrição do dataset

O conjunto de dados é composto por 30.000 registros de clientes, com 23 variáveis explicativas e uma variável-alvo ( default payment next month ) ( uma variável binária, com desbalanceamento: aproximadamente 78% dos clientes são adimplentes e 22% inadimplentes). As variáveis abrangem aspectos sociodemográficos (gênero, idade, estado civil, escolaridade), limites de crédito, histórico de pagamento mensal, faturas e pagamentos realizados entre abril e setembro de 2005.

Principais colunas:

EDA e preparação dos dados