🧠 Avaliação – Capítulo 1

Livro: Fundamentals of Data Engineering (Joe Reis & Matt Housley)

Tema: Engenharia de Dados Descrita


1. Conceitos gerais

  1. Segundo os autores, engenharia de dados é:

    a) A análise de grandes volumes de dados históricos.

    b) O desenvolvimento, implementação e manutenção de sistemas e processos que produzem dados consistentes e de alta qualidade.

    c) A criação de dashboards para tomada de decisão.

    d) O estudo estatístico de padrões de dados.

  2. A engenharia de dados é considerada a interseção entre:

    a) Estatística, machine learning e visualização.

    b) Segurança, gerenciamento de dados, DataOps, arquitetura de dados e engenharia de software.

    c) Computação gráfica, web design e análise de negócio.

    d) Ciência de dados, análise preditiva e modelagem matemática.

  3. Em relação à ciência de dados, a engenharia de dados é:

    a) A jusante, responsável por consumir dados e gerar valor.

    b) A montante, responsável por obter, preparar e disponibilizar dados.

    c) Uma subárea de BI.

    d) Um ramo da estatística aplicada.


2. Ciclo de Vida

  1. Quais são as etapas do ciclo de vida da engenharia de dados?

    a) Extração, Limpeza, Carregamento, Visualização, Consumo.

    b) Coleta, Armazenamento, Mineração, Treinamento, Deploy.

    c) Geração, Armazenamento, Ingestão, Transformação, Servir.

    d) Planejamento, Modelagem, Integração, Predição, Avaliação.

  2. A etapa de transformação envolve principalmente:

    a) Capturar dados de APIs externas.

    b) Converter, limpar e padronizar dados para uso analítico.

    c) Salvar dados brutos em data lakes.

    d) Treinar modelos de ML.

  3. As correntes subjacentes ao ciclo de vida incluem:

    a) Governança corporativa, RH, financeiro.

    b) Segurança, gerenciamento de dados, DataOps, arquitetura e engenharia de software.

    c) Analytics, machine learning, relatórios, predição e estatística.

    d) Scrum, DevOps, Agile e Kanban.


3. Evolução e contexto

  1. A engenharia de dados moderna tem suas origens principalmente:

    a) Nos sistemas de data warehouse das décadas de 1980–1990.

    b) No surgimento da computação gráfica.

    c) No uso de IA em larga escala.

    d) Nos bancos de dados NoSQL criados após 2020.

  2. O Hadoop foi inspirado em quais artigos publicados pelo Google?

    a) GFS e MapReduce.

    b) AWS e DynamoDB.

    c) BigQuery e TensorFlow.

    d) Spark e Presto.

  3. O termo “big data” perdeu força porque:

    a) As empresas deixaram de gerar dados em grande volume.

    b) A infraestrutura se tornou simples e acessível, tornando o termo redundante.

    c) Hadoop foi proibido comercialmente.

    d) O conceito se mostrou incorreto cientificamente.

  4. A principal inovação da nuvem pública foi:

    a) Substituir servidores físicos por locais remotos.

    b) Permitir acesso sob demanda e pagamento conforme o uso.

    c) Armazenar dados em fita magnética.

    d) Remover a necessidade de segurança digital.