Ficha Técnica: Análise de Disponibilidade e Mercado do Airbnb em NY
- Título do Projeto: Business Intelligence para o Mercado Airbnb: Análise de Padrões de Preço e Disponibilidade em Nova York.
- Objetivo: Realizar a exploração e análise de dados relacionados à disponibilidade de quartos no Airbnb, utilizando ferramentas e conceitos de Business Intelligence (BI) para revelar padrões de mercado, identificar oportunidades para anfitriões e aprimorar a tomada de decisões estratégicas.
- Equipe: Individual
- Ferramentas e Tecnologias:
- Google BigQuery: Utilizado como Data Warehouse para armazenar e gerenciar as tabelas de dados após a limpeza, e para executar transformações finais via SQL.
- Google Colab (Python/Pandas): Empregado para o processo de limpeza profunda (Data Cleaning) e padronização dos dados brutos em CSV.
- Power BI: Ferramenta principal para modelagem de dados, criação de métricas (DAX), análises exploratórias e desenvolvimento do dashboard interativo.
- PowerPoint: Usado para o design e prototipação do layout do dashboard.
- Notion: Utilizado para organização do cronograma do projeto e documentação inicial.
- Google Gemini: Utilizado como assistente de IA para orientação de aprendizado, debugging de código e desenvolvimento de insights.
- Linguagens:
- SQL: Para transformações e consultas no BigQuery.
- DAX: Para criação de colunas calculadas e medidas no Power BI.
- Python: Para a limpeza e preparação inicial dos dados.
Processamento e Análise dos Dados
O projeto seguiu um fluxo de trabalho de BI completo, desde a ingestão e limpeza até a visualização final.
- Processamento e Preparação da Base de Dados:
- Desafio Inicial: As tabelas em formato CSV apresentaram múltiplas inconsistências, impedindo a importação direta e correta no BigQuery.
- Limpeza com Python (Google Colab): A solução foi realizar um pré-processamento robusto para padronizar textos, tratar valores nulos e corrigir tipos de dados.
- Armazenamento no BigQuery: Os arquivos CSV limpos foram carregados no BigQuery, criando tabelas base.
- Transformação Final com SQL: Consultas
CREATE OR REPLACE TABLE
foram executadas para criar as tabelas finais (hosts_final
, rooms_final
, reviews_final
), aplicando as últimas regras de negócio e garantindo a integridade dos tipos de dados.
- Modelagem de Dados e Análise (Power BI):
- Conexão: O Power BI foi conectado diretamente às tabelas finais no BigQuery.
- Modelo Relacional: Foi criado um Esquema Estrela, relacionando as tabelas de dimensão com a tabela de fatos.
- Análise Exploratória: A partir do modelo, foram criados visuais para explorar os dados e responder perguntas de negócio.
Dashboard: Análise de Dados Airbnb
O dashboard final consolida os principais insights da análise em um painel interativo.
- Principais Métricas (KPIs) Finais:
- Total de Anfitriões: Aproximadamente 37.380
- Total de Reviews: Aproximadamente 1.000.000
- Total de Quartos: Aproximadamente 49.000
- Disponibilidade Média: Aproximadamente 112 dias por ano
- Visualizações Criadas:
- Distribuição de Preços: Histograma que mostra a forte concentração de anúncios com preços abaixo de $150.
- Localização dos Quartos: Mapa geográfico que evidencia a alta densidade de quartos em Manhattan e Brooklyn.
- Tipos de Quartos: Gráfico de rosca que destaca "Entire home/apt" (52.28%) e "Private room" (45.45%) como os tipos dominantes.
- TOP 5 Bairros: Gráfico de barras que classifica os bairros com maior número de anúncios.
Resultados e Conclusões
- Mercado Altamente Competitivo no Segmento Econômico: A grande maioria dos anúncios se concentra na faixa de preço abaixo de $150, indicando que a competição por preço é o principal desafio para novos anfitriões.
- Concentração Geográfica: A oferta de quartos está massivamente focada nos bairros de Manhattan e Brooklyn, que são os principais polos turísticos e de negócios.
- Privacidade é Prioridade: A preferência esmagadora por "Apartamentos Inteiros" e "Quartos Privados" sugere que os hóspedes neste mercado valorizam a privacidade.