Imagínese un futuro de ciencia ficción,
en el que los humanos son controlados por un enjambre de datos
individuales que cooperan formando una conciencia colectiva capaz de
anticipar nuestros movimientos, decisiones y hábitos. Ese mundo de
ciencia ficción puede ser este en el que vivimos, y a esa conciencia
colectiva se la conoce con el reverente nombre de Big Data.
Pero, ¿qué significa realmente Big Data? Para definir la nueva deidad
informática, los expertos emplean las llamadas “tres Vs”: volumen,
velocidad y variedad. La primera V, volumen, indica que hablamos de
tantos datos que no caben en un disco duro normal, ni siquiera en uno
realmente grande. Hacen falta multitud de ordenadores conectados entre
sí, formando lo que se acostumbra a llamar un clúster. Los miembros del
clúster pueden estar repartidos por todo el mundo y conectados a través
de internet, pero en la práctica las grandes empresas gustan de
agruparlos en Centros de Datos, los Fort Knox modernos que almacenan el
oro del siglo XXI, los datos. Por ejemplo, cuando suba su siguiente foto
a Facebook, es posible que su imagen se aloje cómodamente en Lulea,
localidad sueca próxima al círculo Polar Ártico, donde la compañía tiene
uno de sus centros de datos emblemáticos. El frío ártico resulta en
este caso un aliado que permite ahorrar enormes cantidades de dinero en
refrigeración.
La segunda V, la de velocidad, nos habla de datos que llegan sin
parar. Puede tratarse de tuits sobre un determinado tema que se están
registrando para su posterior análisis, o datos que provienen de un
sensor de presencia que emite una señal cada vez que alguien entra en un
establecimiento.
Y esto nos lleva a la tercera V, la variedad. Un buen ejemplo lo
encontró Google, cuando empezó a almacenar páginas web para su
todopoderoso buscador. Resulta que había (y hay) páginas con formato
para todos los gustos: con solo texto, otras con fotos o incluso con
vídeos o música. Las bases de datos habituales, llamadas relacionales o
SQL por el lenguaje de consultas en el que se basan, no cuadran bien en
este entorno, porque exigen determinar de antemano un formato fijo para
sus datos, en este caso el formato genérico de una página web. Por ello,
Google creo su Big Table, una tabla gigante capaz de almacenar datos
heterogéneos. Hoy en día los sistemas Big Data emplean a menudo
almacenes de datos de este tipo, agrupados bajo el nombre genérico de
“bases de datos NoSQL”.
Si nos hemos quedado con ganas de más Vs, podemos añadir una cuarta: veracidad,
que más bien debería ser “falta de veracidad”, porque en este contexto
se suele asumir que entre los datos puede haber algunos inexactos, o
incluso incorrectos. Y no importa, porque para los análisis Big Data lo
que cuenta no es el dato individual, sino el análisis del conjunto de
datos.
Con todo su poder, Big Data no deja de ser una deidad menor al servicio del dios supremo del beneficio económico
Y ya lanzados, no debemos olvidar una quinta V, la de valor.
Porque, con todo su poder, Big Data no deja de ser una deidad menor al
servicio del dios supremo del beneficio económico, al que rinde culto
mediante complejos análisis encargados de convertir los datos en
tendencias y relaciones ocultas a nuestra pobre vista humana. Estos
análisis ya son parte fundamental de la “inteligencia de negocio” de las
grandes compañías, es decir que ayudan de forma significativa a tomar
decisiones sobre el futuro de la empresa, lo que resulta a la vez
admirable e inquietante.
Pero no debemos olvidar que el nuevo dios precisa para sobrevivir y
crecer de las ofrendas que nosotros, sus fieles, le entregamos
magnánimamente: los datos.
Por ejemplo, seguro que todos hemos instalado alguna aplicación en
nuestro móvil que nos ha pedido amablemente permiso para acceder a
nuestra ubicación (que no necesita) a nuestros contactos (que no
debieran importarle) o incluso a nuestras fotos (innecesarias para el
funcionamiento de la aplicación). Pues bien, si en ese momento, llevados
por el deseo de tener la nueva app, hemos pulsado “Aceptar”, tengamos
por seguro que, en algún remoto centro de datos, el dios Big Data nos ha
sonreído. Más datos gratis, gracias.
Rafael Caballero es profesor contratado doctor de la Universidad Complutense de Madrid.
Mail: enviotp@gmail.com En AS.: JVG CA Taller TIC (su nombre y apellido)
En un mundo donde los cambios se suceden vertiginosamente, incluso los tecnológicos, es menester asimilar las nuevas tecnologías para su aplicación inmediata y a futuro.