¿Cómo aprende una máquina? La lógica detrás de la IA

El día que una computadora aprendió a leer frutas

Era un martes por la mañana en el centro de distribución de Liverpool en Ecatepec. Una cámara instalada sobre una banda transportadora escaneaba cajas de mango que llegaban de Michoacán. En cuestión de milisegundos, el sistema marcaba cuáles estaban maduras, cuáles verdes y cuáles dañadas. Sin un solo humano mirando la pantalla.

Lo curioso es que nadie le programó a esa computadora las reglas del mango maduro. Nadie escribió un código que dijera: "si el color es amarillo-naranja con manchas cafés, entonces está maduro." La máquina llegó a esa conclusión sola. ¿Cómo es posible eso?

Ahí está el corazón de la inteligencia artificial moderna. Y la respuesta no tiene nada de magia.

La diferencia entre programar y aprender

Una computadora tradicional sigue instrucciones exactas. Tú escribes las reglas, ella las ejecuta. Si el precio es mayor a $500, aplica descuento. Punto. La computadora no improvisa ni aprende nada nuevo.

Una IA funciona diferente. En lugar de recibir reglas, recibe ejemplos. Muchos ejemplos. Y a partir de esos ejemplos, ella misma descubre los patrones.

Piénsalo así: cuando tú eras niño, nadie te explicó la gramática para enseñarte a hablar. Escuchaste a tu mamá, a tu abuelita, a la tele, y tu cerebro construyó las reglas solo. La IA hace exactamente lo mismo, pero con datos en lugar de conversaciones.

Tres ingredientes para que una máquina aprenda

Todo sistema de IA que aprende necesita tres cosas: datos, un modelo y retroalimentación. Cuando los tres trabajan juntos, ocurre algo notable.

Los datos son los ejemplos. Pueden ser fotos de mangos, historiales de compras en Mercado Libre, correos electrónicos de clientes de FEMSA, o grabaciones de llamadas de un call center. Entre más datos, mejor aprende la máquina. Esto no es opinión: un estudio de Google mostró que duplicar la cantidad de datos de entrenamiento reduce los errores del modelo casi a la mitad.

El modelo es la estructura matemática que procesa esos datos. No necesitas entender cómo funciona por dentro, igual que no necesitas saber mecánica para manejar un coche. Lo importante es saber que el modelo busca patrones: conexiones repetidas entre los datos de entrada y los resultados esperados.

La retroalimentación es la corrección. Cuando el modelo se equivoca, recibe una señal de error y ajusta sus parámetros internos. Luego intenta de nuevo. Y otra vez. Y otra vez. Este proceso se llama entrenamiento, y puede repetirse millones de veces en cuestión de horas.

Cómo aprende: el ejemplo del correo no deseado

Imagina que eres ingeniero en Bimbo y quieres que tu sistema de correo electrónico detecte spam automáticamente. ¿Cómo le enseñas a la IA?

Primero le das miles de correos etiquetados. Unos tienen la etiqueta "spam" y otros la etiqueta "normal". La IA analiza esos correos buscando patrones. Descubre que los correos spam suelen contener frases como "gana dinero fácil", tienen muchos signos de exclamación y vienen de dominios desconocidos.

Cuando llega un correo nuevo, el modelo calcula la probabilidad de que sea spam basándose en esos patrones. Si la probabilidad es mayor al 90%, lo manda a la carpeta de no deseados. Si se equivoca y tú lo corriges, el sistema toma nota y mejora.

Eso es aprendizaje automático en acción. Sin reglas escritas a mano. Sin un programador definiendo qué es spam. La máquina lo dedujo sola a partir de ejemplos.

El secreto que nadie te dice: la cantidad importa más que la calidad

Aquí viene la parte contraintuitiva. Mucha gente asume que la IA aprende como un experto humano: con poca información muy bien seleccionada. La realidad es al revés.

Los mejores modelos del mundo se entrenaron con cantidades absurdas de datos. El modelo de lenguaje GPT-4 fue entrenado con aproximadamente 1 billón de palabras. No todas eran de alta calidad. Había artículos mediocres, comentarios de internet, textos con errores. Pero la cantidad permitió que el modelo encontrara patrones que serían invisibles con menos datos.

En México, empresas como Mercado Libre tienen una ventaja enorme por esta razón. Cada año procesan más de 400 millones de transacciones. Cada búsqueda, cada compra y cada devolución es un dato que entrena sus sistemas de recomendación. Por eso cuando buscas "tenis para correr", el sistema ya sabe mostrarte primero los que tienen más probabilidad de que compres tú, no cualquier persona.

Tres tipos de aprendizaje que debes conocer

No toda IA aprende de la misma manera. Hay tres enfoques principales, y entenderlos te ayuda a saber qué herramienta usar para qué situación.

El aprendizaje supervisado es el más común. Le das al modelo ejemplos con respuestas correctas: "este correo es spam", "este cliente va a cancelar su suscripción", "esta imagen muestra un producto defectuoso". El modelo aprende a predecir la respuesta correcta para casos nuevos. Los sistemas de detección de fraude del SAT funcionan así.

El aprendizaje no supervisado funciona sin etiquetas. Le das datos crudos y el modelo busca grupos o estructuras por su cuenta. Si le das los historiales de compra de un millón de clientes de FEMSA sin decirle nada, el modelo podría descubrir que hay cinco tipos distintos de consumidor. Eso sirve para segmentar mercados sin que un humano defina los segmentos de antemano.

El aprendizaje por refuerzo es diferente a los dos anteriores. El modelo aprende a tomar decisiones jugando. Recibe puntos cuando hace algo bien y penalizaciones cuando se equivoca. Así aprenden los sistemas que juegan ajedrez o que controlan brazos robóticos en plantas de manufactura. Es el tipo de aprendizaje más parecido a cómo entrenamos a un perro: premio y corrección, repetidas veces.

¿Y si la IA aprende mal?

Aquí hay algo importante que no te van a decir en los comerciales. La IA aprende de los datos que le das, y si esos datos tienen sesgos, la IA también los aprenderá.

Hubo un caso real en una empresa de recursos humanos en Estados Unidos que entrenó un sistema para filtrar currículums. Le dio como datos los currículums de sus empleados más exitosos de los últimos diez años. El problema fue que la mayoría de esos empleados eran hombres. El sistema aprendió que los currículums "buenos" eran los de hombres y empezó a descartar automáticamente los de mujeres. Nadie lo programó para hacer eso. Lo dedujo solo, del patrón en los datos.

Esto tiene una implicación práctica para ti. Cuando uses herramientas de IA en tu trabajo, no asumas que el resultado es neutro o perfecto. La IA hereda los sesgos de quien la entrenó y de los datos que usó. Tu criterio humano sigue siendo necesario.

El mango de Ecatepec, revisitado

Volvamos al centro de distribución de Liverpool. Ahora sabes lo que pasó antes de esa mañana del martes. Alguien recopiló miles de fotos de mangos: maduros, verdes, golpeados, perfectos. Los etiquetó uno por uno. Un modelo procesó esas fotos millones de veces, ajustando sus parámetros cada vez que se equivocaba. Después de semanas de entrenamiento, el sistema había visto tantos mangos que empezó a reconocer patrones que ni un experto humano sabría describir con palabras.

Lo fascinante es que ese mismo proceso, con datos diferentes, puede detectar fraudes bancarios, predecir cuándo una máquina de Bimbo va a fallar antes de que falle, o sugerirte la próxima serie que vas a ver en tu plataforma de streaming.

La lógica es siempre la misma: datos, modelo, retroalimentación. Ejemplos, patrones, corrección. No es magia. Es repetición a escala industrial.

Y ahora que entiendes cómo aprende una máquina, estás listo para entender qué puede hacer por ti.