Siete lecciones para lidiar con los datos de una pandemia (parte IV)
El siguiente artículo contiene las lecciones 5 y 6 de una serie llamada "Siete lecciones para lidiar con los datos de una pandemia" escrita por Ricardo Baeza-Yates y Karma Peiró para El Periodista.
Karma Peiró es periodista especializada en las Tecnologías de la Información y las Comunicación (TIC) desde 1995. Ricardo Baeza-Yates es Doctor en Ciencia de la Computación por la University of Waterloo en Canadá y Director de Ciencia de Datos de Northeastern University en su sede del Silicon Valley
LECCIÓN 7: La obsesión por compararse
Dado todo lo anterior, si los criterios son diferentes de un país a otro, es muy difícil compararlos, aunque midan lo mismo. ¿Tiene sentido comparar dos conjuntos de números si todos los demás factores que rodean la propagación de la enfermedad son diferentes? Pues eso es lo que más se ha hecho, aunque sea muy difícil hacer comparaciones justas entre países. Más aún, se distrae a la opinión pública midiendo los países que están peor, sesgando la comparación, ya sea por diseño o por ignorancia. Y pareciera que esta obsesión tiene un sesgo masculino, tanto en los líderes como en los analistas que lo hacen.
De la segunda lección aprendemos que comparar casos no tiene sentido, pues ellos dependen de la estrategia y número de test hechos. Comparar tests por millón de habitantes tiene sentido, ya que indica cuán bien conocemos la situación. Pero esto favorece a países con poca población, como son Islandia y Emiratos Árabes Unidos que han testeado a más del 15% de sus habitantes –si consideramos todos los tipos de tests (al 15 de mayo)–. Pero si sólo consideramos PCR –el test más exacto– el orden cambia, como vemos abajo.
De la tercera lección podemos rescatar que comparar fallecimientos es lo único que podría tener sentido. Pero para ser justos debemos usar un punto de partida común para eliminar las diferencias temporales, como usar para cada país el día en el cual ya fallecieron al menos 3 personas. Por supuesto, los países más poblados prefieren usar muertes por millón de habitantes para salir favorecidos, pero esto es incorrecto cuando el porcentaje de infectados es una minoría, ya que el contagio avanza gracias a la densidad de gente en los medios de transporte y zonas más transitadas de las grandes ciudades, lo que no siempre implica más habitantes. Y tampoco hay que usar la tasa de letalidad, pues al final sólo depende del virus y de la demografía y salud de la población. Si lo hacemos, sólo estamos midiendo la prevalencia del contagio en los tests que hacemos.
¿Y por qué tenemos que compararnos? Mil fallecidos más o menos no significa que lo estamos haciendo peor o mejor, en ambos casos la situación es grave. Más aún, para aprender de otros, no siempre necesitamos compararnos.
En futuras pandemias…
Esta crisis nos ha enseñado que los datos son prioritarios para avanzar y resolver. La OMS tendría que haber dado a los gobiernos un protocolo de recogida de datos confiables. No lo hizo para el COVID-19, pero confiamos que lo haga para futuras pandemias. Por otro lado, si en todas las reuniones de urgencia gubernamentales se hubiera incluido a una persona Responsable de los Datos, muy probablemente se hubiera comunicado la evolución de la pandemia de una manera más clara y real. En una crisis es difícil tener datos de calidad, pero siempre se pueden tener protocolos claros para hacer lo mejor posible en una emergencia.
La primera lección nos indica la importancia de la recogida de datos que en este caso depende principalmente de las políticas de testeo. Por otro lado, los datos son imprecisos por la naturaleza de la pandemia y de la diversidad de criterios para contabilizarlos (lecciones 2 y 3), así que en este tipo de crisis, calidad al final significa veracidad, no exactitud. La lección 4 nos agrega la dimensión temporal que complica aún más la interpretación de los datos. Vemos además que es deseable tener datos abiertos resguardando la privacidad (lecciones 5 y 6), que sin embargo no sirven de nada si no son datos de calidad. Esto ha pasado en México, donde la transparencia de los datos ha reflejado la poca calidad de ellos. La última lección nos enseña que no es necesario hacer comparaciones, más aún cuando es difícil que sean justas.
Quizás, antes de acabar, debiéramos plantearnos algunas preguntas éticas, surgidas durante la pandemia. ¿Es el beneficio social más importante que el individual? ¿A cuántas personas podemos afectar si no hacemos un esfuerzo colectivo? Son conocidas las declaraciones de los presidentes Trump y Bolsonaro poniendo por delante la economía a la protección de las personas mayores. En una crisis socio-económica como la que estamos viviendo, ¿el gobierno tiene derecho a saltarse los derechos adquiridos con la promesa del bien común? ¿Hasta cuándo?
Mapamundi del brote del Covid-19
No tenemos todas las respuestas, pero las lecciones aprendidas deberían servirnos para mejorar las estrategias de los próximos meses y años, porque después del coronavirus ya nada será igual. Una primera medida sería tener planes de emergencia preparados para nuevas crisis. Otra, que se considerase la transparencia de los datos como un derecho ciudadano prioritario. Y una última, que el acceso a Internet sea un nuevo derecho humano, para que la brecha digital no ahonde más en las desigualdades económicas que ya existen.
Siete lecciones para lidiar con los datos de una pandemia
Parte I: Errores en la recogida de datos
Lección 1
Parte II: Caos para contabilizar los muertos
Lección 2,3,4
Parte III: La importancia de la transparencia
Lección 5,6
Parte IV: La obsesión por compararse
Lección 7
Ricardo Baeza-Yates es Ph.D. en Ciencia de la Computación y Director de Ciencia de Datos de Northeastern University en el Silicon Valley, además de investigador a tiempo parcial en universidades de Cataluña y Chile. Es Fellow de ACM e IEEE.
Karma Peiró es periodista especializada en Tecnologías de la Información y la Comunicación desde 1995. Sus intereses son la ética de la inteligencia artificial y la transparencia algorítmica.