Introducción

Objetivos

¿En qué lugares programar para ciencia de datos?

Existen muchas plataformas para trabajar en Data Science, se recomiendo usar algún Sistema Operativo basado en UNIX usando Linux, MacOS o WSL en Windows, en editores estan VSCode, PyCharm, Deepnote, Google Colab, y el que usaremos Jupyter, todo basado en Notebooks que te permiten ir ejecutando trozos de código, en el cual puedes escribir pocas lineas de código probarlas, asegurarse de que estén bien y seguir adelante con otro trozo, allí también se pueden añadir código, ecuaciones, gráficas, texto enriquecido, etc.

Notebooks

El origen de los notebooks lo dió el Físico Colombiano Fernando Pérez con IPython.

Los notebooks se basan en hacer REPL (Read Evaluate Print Loop).

Untitled

Te permiten tener tanto código como texto enriquecido, ecuaciones, gráficas

Untitled

Los notebook te permites correr cada celda de forma separada pero manteniendo las variables que se van creando.

Estos se pueden presentar como reportes ejecutables

Notebooks Vs Scripts

Ambos son útiles, aunque los Scripts son mas directos, los Notebooks te permiten ver lo que haces, a medida de que lo haces, en estos puedes encargarte de experimentar y hacer el prototipado de tu script y finalmente pasarlo a un Script cuando ya este listo y estés seguro de que todo funciona como es esperado

Tipos de Notebooks

Hay notebooks que se ejecutan en la nube y de forma local, veremos primero dos que operan en la nube: