Configurar tu entorno de trabajo significa instalar Python, Jupyter Notebook y las bibliotecas necesarias para que puedas analizar datos desde tu propia computadora.
Esta lección te guía paso a paso. Al terminar, tendrás todo listo para escribir código y explorar datos reales.
Lo que vas a instalar
Necesitas cuatro componentes principales:
| Componente | ¿Para qué sirve? |
|---|---|
| Python 3.11+ | El lenguaje base del curso |
| pip | El gestor de paquetes de Python |
| Entorno virtual | Aísla las dependencias de tu proyecto |
| Jupyter Notebook | El editor interactivo donde escribirás tu código |
| pandas, NumPy, Matplotlib | Las bibliotecas de análisis de datos |
Instalar estos componentes en orden evita conflictos y errores difíciles de diagnosticar.
Paso 1 — Instalar Python
Python es el lenguaje que usarás durante todo el curso. La versión recomendada es la 3.11 o superior.
Descarga el instalador oficial desde python.org/downloads. Elige la versión para tu sistema operativo: Windows, macOS o Linux.
Durante la instalación en Windows, activa la casilla "Add Python to PATH". Si omites este paso, tu terminal no reconocerá el comando python.
Verifica la instalación abriendo tu terminal y ejecutando:
python --version
Debes ver algo como Python 3.11.7. Si ves un número menor a 3.9, descarga la versión más reciente.
Paso 2 — Verificar pip
pip es el gestor de paquetes que viene incluido con Python 3.4 o superior. Te permite instalar bibliotecas con un solo comando.
Verifica que pip esté disponible:
pip --version
Debe mostrar algo como pip 23.3.1. Si no aparece, ejecuta:
python -m ensurepip --upgrade
Mantén pip actualizado con:
pip install --upgrade pip
Una versión desactualizada de pip puede causar errores al instalar pandas o NumPy.
Paso 3 — Crear un entorno virtual
Un entorno virtual es una carpeta aislada donde instalas paquetes sin afectar el resto de tu sistema.
Imagina que trabajas en dos proyectos: uno para analizar ventas de Liverpool y otro para FEMSA. Cada proyecto puede necesitar versiones distintas de pandas. Un entorno virtual por proyecto evita conflictos.
Crea una carpeta para tu proyecto y navega hasta ella:
mkdir analisis-datos
cd analisis-datos
Crea el entorno virtual:
python -m venv entorno
Esto genera una carpeta llamada entorno dentro de tu proyecto.
Activa el entorno virtual:
- En Windows:
entorno\Scripts\activate
- En macOS / Linux:
source entorno/bin/activate
Sabrás que el entorno está activo porque verás (entorno) al inicio de tu línea de comandos:
(entorno) C:\analisis-datos>
A partir de este momento, todo lo que instales con pip quedará dentro de este entorno y no afectará otros proyectos.
Paso 4 — Instalar las bibliotecas del curso
Con el entorno virtual activo, instala las cuatro bibliotecas principales en un solo comando:
pip install jupyter pandas numpy matplotlib
Pip descargará e instalará cada paquete y sus dependencias. El proceso tarda entre uno y cinco minutos según tu conexión a internet.
Verifica que cada biblioteca se instaló correctamente:
pip show pandas
pip show numpy
pip show matplotlib
pip show jupyter
Cada comando muestra la versión instalada y la ubicación del paquete.
Paso 5 — Abrir Jupyter Notebook
Jupyter Notebook es un editor interactivo que combina código, resultados y texto en un solo archivo .ipynb.
Lanza Jupyter desde tu terminal (con el entorno virtual activo):
jupyter notebook
Esto abre una ventana en tu navegador web, generalmente en la dirección http://localhost:8888. No necesitas conexión a internet para usarlo.
Desde esa pantalla, haz clic en "New" y selecciona "Python 3". Se abre un notebook en blanco donde puedes escribir y ejecutar código.
Paso 6 — Probar tu instalación
Escribe este bloque de código en la primera celda de tu notebook y presiona Shift + Enter para ejecutarlo:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
print("pandas:", pd.__version__)
print("NumPy:", np.__version__)
# Tabla de ejemplo: ingresos de empleados de Bimbo
datos = {
"nombre": ["Ana", "Luis", "Sofía"],
"puesto": ["Analista Jr", "Analista Sr", "Líder de Datos"],
"salario": [18500, 26000, 34000]
}
df = pd.DataFrame(datos)
df["salario_fmt"] = df["salario"].apply(lambda x: f"${x:,}")
print(df[["nombre", "puesto", "salario_fmt"]])
Resultado esperado en pantalla:
pandas: 2.1.4
NumPy: 1.26.2
nombre puesto salario_fmt
0 Ana Analista Jr $18,500
1 Luis Analista Sr $26,000
2 Sofía Líder de Datos $34,000
Si ves estos resultados, tu entorno está funcionando correctamente.
Guardar y reutilizar tu entorno
Siempre que regreses a trabajar en tu proyecto, activa el entorno virtual antes de abrir Jupyter:
cd analisis-datos
source entorno/bin/activate # macOS / Linux
entorno\Scripts\activate # Windows
jupyter notebook
Para compartir tu entorno con un colega o documentarlo, genera un archivo requirements.txt:
pip freeze > requirements.txt
Este archivo lista todas las bibliotecas y sus versiones exactas. Tu colega puede reproducir el mismo entorno con:
pip install -r requirements.txt
Esta práctica es estándar en equipos de datos de empresas como Mercado Libre y FEMSA.
Errores comunes
Error 1 — python no se reconoce como comando
Esto ocurre cuando Python no se agregó al PATH durante la instalación en Windows. Solución: reinstala Python y activa la casilla "Add Python to PATH" antes de continuar.
Error 2 — Instalar paquetes sin activar el entorno virtual
Si instalas pandas sin activar el entorno, el paquete se instala en el sistema global. Luego Jupyter no lo encuentra dentro del entorno del proyecto. Solución: siempre activa el entorno antes de ejecutar pip install.
Error 3 — Jupyter muestra ModuleNotFoundError: No module named 'pandas'
Este error indica que Jupyter está usando un kernel diferente al de tu entorno virtual. Solución: instala el kernel de tu entorno con:
pip install ipykernel
python -m ipykernel install --user --name=entorno
Luego, dentro de Jupyter, selecciona el kernel llamado entorno en el menú Kernel > Change kernel.
Error 4 — Versión de Python inferior a 3.9
pandas 2.x requiere Python 3.9 como mínimo. Si tu sistema tiene una versión anterior, descarga la versión más reciente desde python.org antes de continuar.
Tabla de comandos de referencia
| Acción | Comando |
|---|---|
| Verificar Python | python --version |
| Verificar pip | pip --version |
| Crear entorno virtual | python -m venv entorno |
| Activar entorno (Windows) | entorno\Scripts\activate |
| Activar entorno (macOS/Linux) | source entorno/bin/activate |
| Instalar bibliotecas | pip install jupyter pandas numpy matplotlib |
| Abrir Jupyter | jupyter notebook |
| Exportar dependencias | pip freeze > requirements.txt |
| Desactivar entorno | deactivate |
Puntos clave
- Instala siempre en orden: Python → pip → entorno virtual → bibliotecas → Jupyter. Saltarte pasos genera errores difíciles de resolver.
- Un entorno virtual por proyecto. Esto evita conflictos de versiones entre proyectos distintos, como los que encontrarías trabajando con datos de Liverpool y FEMSA al mismo tiempo.
- Verifica cada instalación con
pip showo ejecutandoimportdentro de un notebook antes de asumir que todo está listo. - El archivo
requirements.txtes la forma estándar de documentar y compartir tu entorno con otros analistas en tu equipo. - Si Jupyter no encuentra tus bibliotecas, el problema casi siempre es un kernel incorrecto. Instala
ipykernely cambia el kernel desde el menú de Jupyter.