¿Qué es el procesamiento de lenguaje natural y cómo funciona?

El procesamiento de lenguaje natural (PLN) es la rama de la inteligencia artificial que permite a las máquinas leer, entender y generar texto o voz humana.

Una conversación que no debería existir

Era martes por la noche. Karla, vendedora en una tienda de Liverpool en Guadalajara, escribió en el chat de soporte de la empresa: "¿Puedo cambiar mi turno del sábado?". En menos de tres segundos, recibió una respuesta clara con los pasos para hacer el cambio. Nadie respondió desde el otro lado. Era un sistema automático.

Lo curioso no es que el bot respondiera rápido. Lo curioso es que entendió exactamente lo que Karla quería, aunque ella no usó ningún comando especial, ningún menú, ningún formulario. Escribió como si le hablara a una persona, y la máquina lo procesó sin problema.

Eso es precisamente el gran misterio del PLN: ¿cómo logra una computadora entender algo tan desordenado, ambiguo y lleno de contexto como el lenguaje humano?

El problema que nadie anticipó

Durante décadas, los ingenieros pensaron que enseñarle idiomas a una computadora sería fácil. Solo había que escribir reglas. Si el usuario escribe "hola", responde "hola". Si pregunta por el precio, muestra el precio. Parecía lógico.

El problema es que el español —como cualquier idioma— no funciona con reglas fijas. La palabra "banco" puede ser un mueble, una institución financiera o el borde de un río. La frase "qué padre" no habla de ningún padre. "Me cae bien" no tiene nada que ver con caerse. El contexto lo cambia todo.

Los lingüistas calculan que el español tiene más de 100,000 palabras activas en uso cotidiano. Pero el verdadero reto no son las palabras: es la combinación infinita de significados que producen. Una computadora basada en reglas se quiebra ante esa complejidad en cuestión de segundos.

Cómo funciona el PLN por dentro

La solución moderna no usa reglas escritas a mano. Usa estadística, grandes volúmenes de texto y redes neuronales artificiales.

El proceso empieza con algo llamado tokenización. La máquina divide tu texto en piezas pequeñas, llamadas tokens. La frase "quiero rastrear mi pedido" se convierte en algo como: ["quiero", "rastrear", "mi", "pedido"]. Eso le da a la IA unidades manejables para analizar.

Después viene el análisis semántico. El sistema busca el significado detrás de cada token. Para eso, usa modelos entrenados con miles de millones de textos: noticias, libros, conversaciones, foros, redes sociales. Al leer tanto texto, el modelo aprende que "rastrear" y "pedido" aparecen juntos frecuentemente en contextos de compras en línea. Eso le da pistas sobre la intención del usuario.

Finalmente, el modelo genera una respuesta. No copia una respuesta guardada. Predice, palabra por palabra, cuál es el texto más probable y útil dado el contexto. Así funciona ChatGPT, el asistente de Siri, el chat de Mercado Libre y decenas de herramientas más.

El número que lo explica todo

GPT-4, uno de los modelos de PLN más avanzados del mundo, fue entrenado con aproximadamente 1 billón de palabras. Para comparar: si leyeras un libro de 300 páginas cada semana durante toda tu vida, leerías alrededor de 2,000 libros. Eso equivale a unos 600 millones de palabras. GPT-4 procesó más de 1,600 veces esa cantidad.

Esa escala es lo que hace posible que el modelo entienda contexto, ironía, tecnicismos y hasta errores ortográficos. No porque "entienda" como tú y yo, sino porque ha visto tantas combinaciones de palabras que puede predecir con altísima precisión cuál es la respuesta correcta.

En México, el impacto ya es visible. Se estima que más del 60% de las consultas de soporte en plataformas de comercio electrónico como Mercado Libre son atendidas inicialmente por sistemas de PLN, sin intervención humana. Eso representa millones de conversaciones al mes.

PLN en la vida diaria en México

Quizás ya usas PLN sin saberlo. Cuando le dices a tu teléfono "oye Siri, pon música de banda", el sistema convierte tu voz en texto, analiza tu intención y ejecuta la acción. Eso es PLN aplicado a la voz.

Cuando escribes en el buscador de Mercado Libre "tenis nike talla 27 hombre blanco" y el sistema te muestra exactamente lo que buscas, hay un motor de PLN que interpretó esa cadena de palabras desordenadas y la transformó en una búsqueda estructurada.

Bimbo usa PLN internamente para analizar los comentarios de sus distribuidores en diferentes regiones del país. El sistema detecta patrones en los mensajes: quejas frecuentes, palabras asociadas a retrasos, términos que señalan problemas de temperatura en las rutas. Así, el equipo de operaciones recibe alertas antes de que un problema escale.

FEMSA, por su parte, aplica PLN para clasificar automáticamente los correos y mensajes de proveedores que llegan a sus sistemas de compras. Un mensaje que dice "necesitamos reprogramar la entrega del lunes" es detectado como una solicitud de cambio de agenda, y se redirige al área correcta sin que un humano tenga que leerlo primero.

Lo que el PLN no puede hacer (todavía)

El PLN es poderoso, pero tiene límites claros. El sistema no "entiende" en el sentido humano. No tiene experiencias, emociones ni sentido común real. Puede cometer errores que un niño de 8 años no cometería.

Por ejemplo, si alguien escribe con sarcasmo: "qué buenísimo servicio, tardaron tres semanas en entregar mi pedido", algunos sistemas de PLN clasifican ese mensaje como positivo porque detectan la palabra "buenísimo". Detectar ironía es uno de los problemas más difíciles del campo.

También hay sesgo en los modelos. Si el texto con el que se entrenó el modelo contiene prejuicios (y casi siempre los contiene), el modelo los aprende. Empresas mexicanas que implementan sistemas de PLN para recursos humanos, por ejemplo, deben revisar que el sistema no favorezca perfiles de candidatos basándose en características irrelevantes.

Además, el PLN en español tiene un reto extra: la variación regional. El español de Monterrey no es igual al de la Ciudad de México, y ninguno es igual al de España. Las palabras "chido", "padrísimo" o "está cañón" tienen significados que un modelo entrenado principalmente en inglés puede malinterpretar. Por eso, los modelos especializados en español mexicano tienen cada vez más demanda en el mercado local.

De regreso con Karla

Karla recibió su respuesta en tres segundos. Siguió los pasos, cambió su turno y siguió con su noche. No pensó en tokens, ni en redes neuronales, ni en billones de palabras de entrenamiento.

Pero detrás de esos tres segundos había décadas de investigación, millones de textos en español procesados y un modelo que aprendió a entender la intención humana con una precisión que ningún programador pudo haber escrito a mano.

Eso es el procesamiento de lenguaje natural: la tecnología invisible que ya está en tu teléfono, en los chats de las tiendas donde compras y en las herramientas que usas para trabajar. Entender cómo funciona te da una ventaja real: sabes cuándo confiar en él, cuándo revisarlo y cómo usarlo mejor.