Los datos masivos se generan en cada segundo del día, en cada rincón del mundo, sin que nadie los ordene o planifique.
Un martes ordinario en la Ciudad de México
Eran las 7:43 de la mañana. Sofía, contadora de 28 años en la colonia Nápoles, desbloqueó su teléfono para revisar Instagram. Publicó una foto de su café. Luego abrió Mercado Libre para rastrear un paquete. Antes de llegar al metro, ya había producido docenas de datos sin notarlo.
Eso es lo fascinante: nadie se sienta a "crear datos". Los datos aparecen como consecuencia de vivir en un mundo digital. Y eso ocurre 130 millones de veces al día, solo en México.
La pregunta que cambia todo
Aquí está el dato que sorprende a casi todos: en el año 2025, el mundo genera aproximadamente 2.5 quintillones de bytes de datos cada día. Un quintillón tiene 18 ceros. Para comparar, todos los libros jamás escritos por la humanidad ocuparían apenas unos pocos petabytes. El mundo moderno supera esa cifra cada pocos minutos.
¿De dónde viene todo eso? La respuesta no es una sola fuente. Son cuatro grandes familias de orígenes que trabajan juntas, sin descanso, los 365 días del año.
Las redes sociales: la fábrica de opiniones
Cada vez que alguien publica, comenta, da "me gusta" o comparte algo en TikTok, Facebook o X (antes Twitter), genera un registro digital. Ese registro incluye el texto, la hora exacta, el dispositivo, la ubicación aproximada y el comportamiento del usuario antes y después.
En México, más de 83 millones de personas usan redes sociales activamente. Si cada persona produce solo 10 interacciones al día, eso equivale a 830 millones de eventos de datos diarios, solo en redes. Y eso sin contar los videos, los audios y las imágenes.
Empresas como Liverpool usan esos datos para entender qué productos están de moda antes de que la temporada llegue. Si miles de usuarios en Monterrey empiezan a hablar de cierto estilo de zapato, Liverpool puede ajustar su inventario antes de que la demanda explote. Sin Big Data, ese ajuste llegaría demasiado tarde.
Los sensores: el sistema nervioso del mundo físico
Aquí viene la parte que mucha gente no ve. El mundo físico también genera datos, gracias a millones de sensores conectados.
Un sensor es cualquier dispositivo que mide algo del entorno: temperatura, presión, movimiento, luz, velocidad. Tu teléfono tiene al menos 10 sensores. Un auto moderno tiene más de 200. Una planta de Bimbo en Toluca puede tener miles de sensores monitoreando hornos, bandas de producción y condiciones de almacenamiento.
Cada sensor envía datos cada pocos segundos. Bimbo produce millones de piezas de pan al día. Si un sensor detecta que la temperatura de un horno subió 3 grados fuera del rango ideal, el sistema puede alertar al operador antes de que toda una producción se arruine. Eso vale millones de pesos en pérdidas evitadas.
En México, el sector industrial está adoptando sensores con rapidez. La industria automotriz en Guanajuato, los campos agrícolas inteligentes en Sonora y las plantas cerveceras de FEMSA en Monterrey ya generan volúmenes de datos de sensores que, hace 10 años, habrían parecido ciencia ficción.
Las transacciones digitales: cada compra es un dato
Cada vez que pagas con tarjeta, haces una transferencia SPEI, compras en Mercado Libre o recargas tu tarjeta del metro, produces una transacción digital. Esa transacción no es solo el monto: incluye la hora, el lugar, el comercio, el método de pago y tu historial previo.
El SAT en México procesa millones de facturas electrónicas cada día. Solo en 2023, se emitieron más de 10,000 millones de facturas electrónicas (CFDI) en todo el país. Cada una es un punto de datos estructurado que el SAT puede cruzar con otros registros para detectar evasión fiscal o patrones económicos.
Mercado Libre procesa cientos de miles de transacciones cada hora en México. Cada compra activa un flujo de datos: inventario actualizado, historial del vendedor modificado, perfil del comprador enriquecido, estimación de entrega recalculada. Una sola transacción puede generar decenas de registros en sistemas distintos.
Eso explica por qué Mercado Libre puede recomendarte exactamente lo que buscabas hace tres días, en el precio que probablemente estás dispuesto a pagar. No es magia. Es el resultado de analizar millones de transacciones anteriores.
Los dispositivos conectados: el Internet de las Cosas
La cuarta gran fuente tiene un nombre técnico: IoT, del inglés "Internet of Things" o Internet de las Cosas. Son todos los aparatos del mundo físico que están conectados a internet y que envían datos de forma continua.
Un refrigerador inteligente que reporta su temperatura. Un medidor de luz de la CFE que transmite el consumo en tiempo real. Un GPS en un camión de reparto de FEMSA que envía su ubicación cada 30 segundos. Una pulsera deportiva que registra tu ritmo cardíaco mientras caminas.
En México, la adopción de dispositivos IoT creció un 34% entre 2021 y 2024, según estimaciones del sector tecnológico. Ciudades como Guadalajara y Querétaro están implementando semáforos inteligentes que ajustan sus tiempos según el flujo real de tráfico, no según horarios fijos. Cada semáforo es, en esencia, un generador de datos.
El resultado de todo esto es una cadena interminable de información que fluye sin parar. Y aquí está el dato más revelador: el 90% de todos los datos del mundo fueron creados en los últimos dos años. Las fuentes que acabas de conocer son responsables de eso.
De vuelta con Sofía en el metro
Regresemos a Sofía. Mientras esperaba el metro Insurgentes ese martes a las 8:10, su teléfono estaba haciendo al menos cuatro cosas al mismo tiempo: actualizando su ubicación GPS, sincronizando sus apps en segundo plano, registrando los pasos que caminó hasta la estación y conectándose a la red WiFi pública del metro.
Sofía no hizo nada especial. Solo vivió su mañana. Pero en ese proceso, contribuyó a los flujos de datos de redes sociales, transacciones digitales y dispositivos conectados, todo antes de las 9:00 a.m.
Multiplica eso por 130 millones de mexicanos. Luego multiplícalo por 8,000 millones de personas en el mundo. Ahí tienes el Big Data.
Por qué esto importa más de lo que parece
Entender de dónde vienen los datos masivos no es un ejercicio teórico. Es la base para saber dónde buscarlos, cómo interpretarlos y qué decisiones pueden derivarse de ellos.
Cuando FEMSA analiza los datos de sus tiendas OXXO, sabe qué producto se vende más en cada colonia, a qué hora y en qué clima. Esa información viene de las transacciones digitales de millones de compras. Con eso, puede ordenar exactamente el inventario correcto para cada tienda, reduciendo desperdicios y aumentando ventas.
Cuando el IMSS monitorea brotes de enfermedades, usa datos de múltiples fuentes: registros médicos digitales, patrones de búsqueda en internet y reportes de farmacias. Combinar esas fuentes permite detectar una epidemia días antes de que los hospitales se saturen.
Las cuatro fuentes, redes sociales, sensores, transacciones digitales y dispositivos IoT, no trabajan solas. Se combinan. Y cuando se combinan bien, producen el tipo de inteligencia que cambia industrias enteras.
En la siguiente lección verás cómo las empresas y los gobiernos almacenan y procesan ese volumen enorme de información. Porque generarlo es solo el primer paso.