certmundo.
es‑mx

6 min de lectura

¿Cómo configurar tu entorno de trabajo con Python y Jupyter?

Configurar tu entorno de trabajo significa instalar Python, Jupyter Notebook y las bibliotecas necesarias para que puedas analizar datos desde tu propia computadora.

Esta lección te guía paso a paso. Al terminar, tendrás todo listo para escribir código y explorar datos reales.

Lo que vas a instalar

Necesitas cuatro componentes principales:

Componente ¿Para qué sirve?
Python 3.11+ El lenguaje base del curso
pip El gestor de paquetes de Python
Entorno virtual Aísla las dependencias de tu proyecto
Jupyter Notebook El editor interactivo donde escribirás tu código
pandas, NumPy, Matplotlib Las bibliotecas de análisis de datos

Instalar estos componentes en orden evita conflictos y errores difíciles de diagnosticar.

Paso 1 — Instalar Python

Python es el lenguaje que usarás durante todo el curso. La versión recomendada es la 3.11 o superior.

Descarga el instalador oficial desde python.org/downloads. Elige la versión para tu sistema operativo: Windows, macOS o Linux.

Durante la instalación en Windows, activa la casilla "Add Python to PATH". Si omites este paso, tu terminal no reconocerá el comando python.

Verifica la instalación abriendo tu terminal y ejecutando:

python --version

Debes ver algo como Python 3.11.7. Si ves un número menor a 3.9, descarga la versión más reciente.

Paso 2 — Verificar pip

pip es el gestor de paquetes que viene incluido con Python 3.4 o superior. Te permite instalar bibliotecas con un solo comando.

Verifica que pip esté disponible:

pip --version

Debe mostrar algo como pip 23.3.1. Si no aparece, ejecuta:

python -m ensurepip --upgrade

Mantén pip actualizado con:

pip install --upgrade pip

Una versión desactualizada de pip puede causar errores al instalar pandas o NumPy.

Paso 3 — Crear un entorno virtual

Un entorno virtual es una carpeta aislada donde instalas paquetes sin afectar el resto de tu sistema.

Imagina que trabajas en dos proyectos: uno para analizar ventas de Liverpool y otro para FEMSA. Cada proyecto puede necesitar versiones distintas de pandas. Un entorno virtual por proyecto evita conflictos.

Crea una carpeta para tu proyecto y navega hasta ella:

mkdir analisis-datos
cd analisis-datos

Crea el entorno virtual:

python -m venv entorno

Esto genera una carpeta llamada entorno dentro de tu proyecto.

Activa el entorno virtual:

  • En Windows:
entorno\Scripts\activate
  • En macOS / Linux:
source entorno/bin/activate

Sabrás que el entorno está activo porque verás (entorno) al inicio de tu línea de comandos:

(entorno) C:\analisis-datos>

A partir de este momento, todo lo que instales con pip quedará dentro de este entorno y no afectará otros proyectos.

Paso 4 — Instalar las bibliotecas del curso

Con el entorno virtual activo, instala las cuatro bibliotecas principales en un solo comando:

pip install jupyter pandas numpy matplotlib

Pip descargará e instalará cada paquete y sus dependencias. El proceso tarda entre uno y cinco minutos según tu conexión a internet.

Verifica que cada biblioteca se instaló correctamente:

pip show pandas
pip show numpy
pip show matplotlib
pip show jupyter

Cada comando muestra la versión instalada y la ubicación del paquete.

Paso 5 — Abrir Jupyter Notebook

Jupyter Notebook es un editor interactivo que combina código, resultados y texto en un solo archivo .ipynb.

Lanza Jupyter desde tu terminal (con el entorno virtual activo):

jupyter notebook

Esto abre una ventana en tu navegador web, generalmente en la dirección http://localhost:8888. No necesitas conexión a internet para usarlo.

Desde esa pantalla, haz clic en "New" y selecciona "Python 3". Se abre un notebook en blanco donde puedes escribir y ejecutar código.

Paso 6 — Probar tu instalación

Escribe este bloque de código en la primera celda de tu notebook y presiona Shift + Enter para ejecutarlo:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

print("pandas:", pd.__version__)
print("NumPy:", np.__version__)

# Tabla de ejemplo: ingresos de empleados de Bimbo
datos = {
    "nombre": ["Ana", "Luis", "Sofía"],
    "puesto": ["Analista Jr", "Analista Sr", "Líder de Datos"],
    "salario": [18500, 26000, 34000]
}

df = pd.DataFrame(datos)
df["salario_fmt"] = df["salario"].apply(lambda x: f"${x:,}")
print(df[["nombre", "puesto", "salario_fmt"]])

Resultado esperado en pantalla:

pandas: 2.1.4
NumPy: 1.26.2
   nombre          puesto salario_fmt
0     Ana      Analista Jr     $18,500
1    Luis      Analista Sr     $26,000
2   Sofía  Líder de Datos     $34,000

Si ves estos resultados, tu entorno está funcionando correctamente.

Guardar y reutilizar tu entorno

Siempre que regreses a trabajar en tu proyecto, activa el entorno virtual antes de abrir Jupyter:

cd analisis-datos
source entorno/bin/activate    # macOS / Linux
entorno\Scripts\activate       # Windows
jupyter notebook

Para compartir tu entorno con un colega o documentarlo, genera un archivo requirements.txt:

pip freeze > requirements.txt

Este archivo lista todas las bibliotecas y sus versiones exactas. Tu colega puede reproducir el mismo entorno con:

pip install -r requirements.txt

Esta práctica es estándar en equipos de datos de empresas como Mercado Libre y FEMSA.

Errores comunes

Error 1 — python no se reconoce como comando

Esto ocurre cuando Python no se agregó al PATH durante la instalación en Windows. Solución: reinstala Python y activa la casilla "Add Python to PATH" antes de continuar.

Error 2 — Instalar paquetes sin activar el entorno virtual

Si instalas pandas sin activar el entorno, el paquete se instala en el sistema global. Luego Jupyter no lo encuentra dentro del entorno del proyecto. Solución: siempre activa el entorno antes de ejecutar pip install.

Error 3 — Jupyter muestra ModuleNotFoundError: No module named 'pandas'

Este error indica que Jupyter está usando un kernel diferente al de tu entorno virtual. Solución: instala el kernel de tu entorno con:

pip install ipykernel
python -m ipykernel install --user --name=entorno

Luego, dentro de Jupyter, selecciona el kernel llamado entorno en el menú Kernel > Change kernel.

Error 4 — Versión de Python inferior a 3.9

pandas 2.x requiere Python 3.9 como mínimo. Si tu sistema tiene una versión anterior, descarga la versión más reciente desde python.org antes de continuar.

Tabla de comandos de referencia

Acción Comando
Verificar Python python --version
Verificar pip pip --version
Crear entorno virtual python -m venv entorno
Activar entorno (Windows) entorno\Scripts\activate
Activar entorno (macOS/Linux) source entorno/bin/activate
Instalar bibliotecas pip install jupyter pandas numpy matplotlib
Abrir Jupyter jupyter notebook
Exportar dependencias pip freeze > requirements.txt
Desactivar entorno deactivate

Puntos clave

  • Instala siempre en orden: Python → pip → entorno virtual → bibliotecas → Jupyter. Saltarte pasos genera errores difíciles de resolver.
  • Un entorno virtual por proyecto. Esto evita conflictos de versiones entre proyectos distintos, como los que encontrarías trabajando con datos de Liverpool y FEMSA al mismo tiempo.
  • Verifica cada instalación con pip show o ejecutando import dentro de un notebook antes de asumir que todo está listo.
  • El archivo requirements.txt es la forma estándar de documentar y compartir tu entorno con otros analistas en tu equipo.
  • Si Jupyter no encuentra tus bibliotecas, el problema casi siempre es un kernel incorrecto. Instala ipykernel y cambia el kernel desde el menú de Jupyter.

Puntos clave

  • Instala Python, pip, el entorno virtual y las bibliotecas en ese orden para evitar conflictos y errores de instalación.
  • Usa un entorno virtual por proyecto para aislar dependencias; así puedes trabajar con distintas versiones de pandas según el análisis que realices.
  • Verifica cada instalación con `pip show` y ejecuta un bloque de prueba en Jupyter antes de comenzar a analizar datos reales.
  • El archivo `requirements.txt` documenta todas las bibliotecas de tu proyecto y permite que un colega reproduzca tu entorno con un solo comando.
  • Si Jupyter lanza el error `ModuleNotFoundError`, el problema es el kernel; instala `ipykernel` y selecciona el kernel de tu entorno virtual.

Comparte esta lección:

¿Cómo configurar tu entorno de trabajo con Python y Jupyter? | Python para Análisis de Datos | Certmundo