Aprovechando
toda esta crisis sanitaria en torno al Covid-19, me gustaría escribir sobre uno
de los fracasos mas sonados del Big Data. Se trata del proyecto Google Flu
Trend(GFT).
En él, Google
trató de predecir con una semana de antelación cuántas personas enfermarían por
gripe basándose en las búsquedas y mensajes compartidos en las RRSS de millones
de personas, lo que se conoce como "datos no estructurados".
Se
trata de algo muy diferente al flujo lento y estructurado de información que
puede recogerse usando los formularios que los pacientes llenan en las salas de
espera de consultorios y hospitales, y que era lo que se utilizaba para hacer
predicciones antes del advenimiento del big data.
El
problema está que el GFT resultó ser terriblemente inexacto.
En un periodo de
108 semanas, en GFT se equivocó 100 veces prediciendo en ocasiones el doble de
los casos reales.
Aquí os
dejo un vídeo que apareció en el teleberri antes de que supiese que
era un fracaso, donde se explica el proceso que se sigue.
Aunque creemos que es imprescindible, aqui se explicas como no siempre triunfa el usos de datos.
ResponderEliminar