(De El Pais, Digital)
El
big data se ha convertido en una de las modas más notables
de nuestro tiempo. Empresas y gobiernos venden innovación acumulando
datos recogidos por todo tipo de medios: millones de mensajes publicados
en redes sociales, señales recogidas en las
ciudades inteligentes,
uso de transporte público conectado, consultas en páginas webs, etc.
Esa huella digital que dejamos —voluntariamente o no— es muy valiosa
porque proporciona datos útiles para diseñar políticas o vender
productos. Pero en los países en desarrollo, donde esa información viva y
en tiempo real sería un recurso decisivo para responder ante
catástrofes o prevenir epidemias, carecen de las herramientas
tecnológicas que sobreexplotamos en el primer mundo. Una pega
importante, pero eso no hace imposible extraer datos valiosos sin
tuiteros, sin teléfonos inteligentes y sin autobuses con wifi. El
ingenio está cubriendo esas carencias, como demuestran algunos proyectos
que ya recopilan información por todo el mundo, lejos de las ciudades
ricas.
Tickets de comida, correo postal, tertulias de la radio, SMS... todo sirve para arañar información que pueda ser procesada
"La huella digital es en lo que nos hemos basado en todos los
estudios de sociología computacional. El problema que nos planteamos es
cómo obtener esta información en lugares en los que no la hay, países
como Uganda, Liberia o Sierra Leona", explica el español Manuel
García-Herranz, que aterrizó hace unos meses desde la Autónoma de Madrid
en la unidad de innovación de UNICEF
para ayudarles a realizar la llamada minería de datos, pero sin pico ni
pala. Tickets de comida, correo postal, tertulias de la radio, SMS...
todo sirve para arañar información que pueda ser procesada y reutilizada
para proteger a las poblaciones mas vulnerables.
Por ejemplo, las conexiones a las torres de comunicación de los
teléfonos móviles convencionales, cuyo uso está muy extendido.
"Explorando las conexiones a una torre podemos inferir los movimientos
de personas a través de los datos de telefonía móvil, como el volumen de
llamadas o los minutos agregados de estas llamadas",
explica García-Herranz. Esos metadatos anónimos han servido para
advertir de corrimientos de tierras y calcular cuánta gente está
afectada al observar que los móviles dejan de conectarse a través de una
determinada torre y que un importante volumen de llamadas se realiza
desde otra cercana.
"Al final se sabría del desastre, pero ganamos tiempo, diez horas
arriba o abajo, que pueden ser muy valiosas: para prevenir epidemias de
cólera que surgen al cabo de unos días y para llevar los recursos de
forma eficiente hacia donde se ha desplazado la gente", indica este
investigador.
Hace unos meses, García-Herranz publicaba junto a otros colegas un estudio sobre la correlación entre desempleo en las regiones españolas y los mensajes escritos en Twitter.
¿De qué sirve saber que hay más paro en aquellas zonas en las que se
tuitean más faltas de ortografía si en España ya hay organismos que
estudian al detalle el desempleo? "En estos países no hay un INEM, sino
encuestas que se hacen cada mucho tiempo, indicadores irregulares.
Nosotros estamos tratando de sacar indicadores intermedios para no estar
en la penumbra durante tantos años. Estudios como el que hicimos del
Twitter español sirve para crear un modelo, en función de las faltas o
la movilidad de los tuits, que se puede aplicar a otras herramientas",
explica.
En este caso se refiere al uso de los SMS, superados en el mundo rico
pero que todavía tienen mucho recorrido en países como Uganda, con una
penetración escasa de internet y casi nula de redes sociales. La
herramienta estrella de UNICEF es el U-Report,
una plataforma de código abierto (libre y modificable) para poder
comunicarse mediante SMS con medio millón de jóvenes —y creciendo— en
doce países de África, Indonesia y México. "Cada país lo ha cambiado
como le ha venido bien, ya que sirve para cerrar el bucle de información
entre la administración y los ciudadanos, y los países intercambian
entre ellos sus avances", señala.
El problema que nos planteamos es cómo obtener
esta información en lugares en los que no hay huella digital", explica
García-Herranz, de UNICEF
Con esos SMS recaban información por medio de encuestas, pero también
pueden usarse de forma activa, como se puso de manifiesto al combatir
plagas en las plantaciones, creando un mapa de las regiones afectadas e
informando de los remedios directamente y sobre la marcha. Otro ejemplo:
en Zambia lanzaron un programa de empleo al que nadie se apuntaba y no
se explicaban la razón. Consultando a los jóvenes por medio de U-Report
descubrieron que se demandaba una titulación que nadie tenía: al poco
tiempo se habían cambiado los requisitos y empezaron a apuntarse.
Este sistema está desempeñando un papel esencial para cubrir lagunas
en asuntos como la prevención de enfermedades de transmisión sexual y demostró su valor con la irrupción de la epidemia de ébola
en África Occidental, donde estos SMS gratuitos han servido para tomar
el pulso de la población, para diseminar información útil sobre malas
prácticas en enterramientos, para hacer frente a bulos peligrosos y para monitorizar la apertura de escuelas.
"El teléfono móvil se ha convertido en una prioridad incluso para las poblaciones mas vulnerables ya que los shocks
o cambios repentinos muchas veces escapan de los sistemas de
recolección clásicos, como las encuestas, que usan tradicionalmente las
organizaciones humanitarias y el sector publico", asegura el asturiano
Miguel Luengo-Oroz, responsable científico de Global Pulse, la iniciativa de Naciones Unidas para el aprovechamiento del big data.
Luengo-Oroz explica que los datos generados por los móviles —recalca
que sólo tras ser anonimizados y agregados para proteger la privacidad
de los usuarios— ofrecen la oportunidad de "realizar análisis en tiempo
real a un coste muy bajo y, en muchos casos, llegar a gente que no se
podría tener en cuenta de otra manera", defiende.
Este innovador social cuenta cómo esta fuente sirve también para
hacer frente a situaciones como la que se da en Indonesia, donde más de
un millón de niños se quedan sin vacunar cada año. "Descubrir los
motivos que llevan a los padres a no inmunizar es fundamental para
actuar. Hemos descubierto que cada día hay unos mil mensajes públicos en
redes sociales hablando de inmunización y las razones para no hacerlo,
como lejanía del centro médico, desconocimiento del número de dosis,
motivos religiosos, falsos mitos...". Esos mensajes permiten reaccionar
rápido y diseñar las campañas de comunicación mas ágiles y eficientes.
El jefe científico del Global Pulse, que asegura que pueden obtener 20 tipos de datos de cada carta de papel
que se envía, reconoce que se ha llevado muchas sorpresas recopilando
información en estas regiones. "En un país africano [no se puede
desvelar], hemos descubierto
que el dinero que la gente gasta en móvil es proporcional al que gasta
en comida en el mercado. El cambio en los patrones de gasto en una
region podría utilizarse como mecanismo de alarma para realizar
investigaciones mas detalladas", asegura. Todo este conocimiento que
generan se pone en común con la comunidad académica: este estudio sobre
móviles y alimentación se presentó esta semana en el NetMob, la principal conferencia de análisis científico del big data
generado por los móviles, que se celebra cada año en el MIT, y que ha
dirigido el español Esteban Moro (que lideraba el estudio del desempleo y
Twitter de García-Herranz). Luengo-Oroz también llevó a este encuentro
de primer nivel otro estudio que analizaba la información obtenida a partir de las llamadas de móviles en las inundaciones de 2009 en Tabasco (México).
"Existe la necesidad de abordar los retos de la invisibilidad y la
inequidad utilizando la revolución de los datos", defiende Paula
Hidalgo-Sanchís, que dirige el laboratorio de Kampala (Uganda)
uno de los tres que el Global Pulse tiene por todo el mundo. Allí
acaban de poner en marcha un innovador proyecto que consiste en obtener información a partir de las más de 200 emisoras de radio
que hay por todo el país, en cuyos programas y tertulias suele
participar la población telefónicamente. Mediante un software de
reconocimiento y transcripción de la voz, se recogen aquellas emisiones
en las que se usan palabras clave como "sequía", "violencia doméstica" o
"brote epidémico" para conseguir información sobre las necesidades y
preocupaciones de la gente en tiempo real y localizada geográficamente.
Un programa de SMS gratuitos ayuda a combatir el ébola, mejorar políticas de empleo o responder a plagas
"El big data, los datos digitales, nos ofrecen la
oportunidad de innovar y entender mejor la situación de desarrollo de
las sociedades, mejorar el diseño de políticas de desarrollo y entender
el impacto de estas políticas", asegura Hidalgo-Sanchís, que pone como
ejemplo el ejercicio que están realizando con el Ministerio de Sanidad
ugandés y la Organización Mundial de la Salud para predecir la expansión
de enfermedades con datos de movilidad humana.
Aunque reconoce que "existen barreras ligadas al necesario cambio de mentalidad para entender lo que la revolución de los datos
significa", cree que se está definiendo "un antes y un después" en la
investigación aplicada al desarrollo, sobre todo porque "el Sur tiene un
papel principal". "La complejidad", reconoce Luengo-Oroz, "reside en la
necesidad de alinear todos los actores necesarios, agencias
internacionales, reguladores, propietarios de datos, expertos en
procesado de datos y aquellos que quieren aplicar las metodologias
innovadoras en temas como salud, planificación urbana o seguridad
alimentaria". Y añade: "Tenemos que encontrar los mecanismos seguros que
permiten la utlizacion de datos que muchas veces están en el sector
privado y tienen un valor increíble para la sociedad y el bien común".