Ficha Técnica - Projeto 2: Hipóteses
Objetivo
Validar ou refutar hipóteses sobre os fatores que influenciam o sucesso de músicas em plataformas digitais, auxiliando decisões estratégicas de uma gravadora para o lançamento de um novo artista com o objetivo de aumentar as chances de sucesso.
Equipe
- Projeto desenvolvido em dupla por Ana Paula de Almeida Coiado e Mariucha Pontes
Ferramentas e Tecnologias
- Google BigQuery (SQL - armazenamento e análise)
- Power BI (visualizações e dashboards)
- Eventualmente Planilhas Google e Python para histogramas
Processamento e Análises
- Importação dos dados
- Criação da base de dados no BigQuery com arquivos .csv disponibilizados (track_in_spotify, track_technical_info, track_in_competition)
- Tratamento de dados
- Tratar dados nulos utilizando os comandos SQL COUNT, WHERE e IS NULL
- Identificar e tratar valores duplicados com comandos SQL COUNT, GROUP BY, HAVING
- Identificar e tratar valores fora do escopo de análise com comandos SQL SELECT EXCEPT
- Identificar e tratar dados discrepantes em variáveis numéricas com comandos MAX, MIN e AVG
- Alteração de tipos de dados com a função CAST e CONVERT
- Salvar as consultas (query) como views (visualização) para posterior utilização
- Criação de novas variáveis
- Criação de novas variáveis com comandos CAST e CONCAT para formatação de data
- Criar views (visualizações) para facilitar a manipulação dos dados
- Unir tabelas com LEFT JOIN e JOIN
- Construir tabelas temporárias com comandos WITH para cálculos
- Análise Exploratória (EDA)
- Download e instalação do Power BI
- Importação das tabelas e views do BigGuery para o Power BI
- Agrupamento de variáveis categóricas no Power BI para visualização
- Utilização de gráficos de barras, tabelas, cartões, gráficos de colunas, dispersão
- Aplicação de medidas de tendência central (média e mediana) em tabelas no Power BI
- Utilização e histograma para visualização da distribuição com instalação do Python para ser utilizado no Power BI
- Aplicação de medidas de dispersão para cálculo através do desvio padrão
- Técnicas de análise
- Criação de categorias com cálculo de quartis no BigQuery
- Cálculo de correlação utilizando conceito de Pearson com comando CORR no BigQuery
- Validação das hipóteses apresentadas através da correlação
- Dashboard
- Apresentação dos principais dados da base com tabela resumo e scorecards
- Representação dos dados com gráficos simples (barras e linhas)
- Aplicação de filtros para gerenciamento e interação