Siete lecciones para lidiar con los datos de una pandemia (Parte II)

El siguiente artículo es el segundo capitulo de una serie llamada "Siete lecciones para lidiar con los datos de una pandemia" escrita por Ricardo Baeza-Yates y Karma Peiró para El Periodista.

Karma Peiró es periodista especializada en las Tecnologías de la Información y las Comunicación (TIC) desde 1995. Ricardo Baeza-Yates es Doctor en Ciencia de la Computación por la University of Waterloo en Canadá y Director de Ciencia de Datos de Northeastern University en su sede del Silicon Valley

LECCIÓN 2: La imprecisión de los datos

El virus se aprovecha de la cercanía física entre personas para expandirse y sobrevivir. Por esta razón, la pandemia es un proceso muy dinámico que depende de muchos factores y basta con que cada enfermo infecte a más de una persona para que el contagio crezca de forma exponencial. Y como además todo pasa muy rápido, hay imprecisión pues no lo sabemos todo.

Los casos informados que conocemos están lejos de ser los reales. Una gran proporción de los enfermos son asintomáticos (estimados en un 40%), los que no saben que están enfermos y siguen contagiando. También este número depende de la cantidad de tests realizados: así que en la mayoría de los países hay el doble o más enfermos de los confirmados. En Chile se estima que el factor es entre 3 y 4 veces, mientras que en Cataluña se estima en 10 veces.

Algo similar ocurre con los recuperados. Es muy difícil hacer seguimiento a cada paciente, sobre todo a los que nunca se han hecho un test. Sólo los hospitalizados son controlados mejor.  Por eso hay países que tienen muy pocos recuperados, como Reino Unido. Y otros como Chile usan fórmulas que los sobreestiman, generando problemas éticos. Si los recuperados no se saben con exactitud, no sabemos tampoco cuántos enfermos activos –de los que conocemos– hay.

Incluso los fallecimientos están subestimados, siendo esto tan grave que merece una lección aparte. Y cuando llega el momento de calcular la letalidad de casos, la mayoría la calcula mal: hay que contar los enfermos que habían cuando los fallecidos se enfermaron y no los de hoy, usando el número promedio de días que pasa entre el informe del test y el fallecimiento, por lo que siempre queda más baja de lo que realmente es. Pero por otro lado, la tasa de letalidad final será menor, pues como ya dijimos no sabemos el número real total de enfermos.

Debido a todas estas aproximaciones, cualquier análisis es impreciso y cualquier conclusión tiene que ser considerada con mucho cuidado. Es como ir en un coche con el parabrisas con barro: puede ser peligroso conducir en esas condiciones. Y en este caso no conducir no es una opción válida.

LECCIÓN 3: Caos para contabilizar los muertos

Algo que parece difícil de creer es que el número de fallecidos no sea exacto. Porque… ¿cuál es el motivo de fallecimiento si una persona tenía una enfermedad previa y muere de COVID-19? La respuesta es distinta en cada país: en muchos ya existe otra enfermedad. En Estados Unidos hay un incentivo económico para decir que fue por COVID-19, ya que en ese caso el hospital recibe más dinero de Medicare, el programa federal de salud.

¿Y qué pasa si murió por COVID-19 y no lo sabemos? En algunos países se hace un test, pero en la mayoría no. En otros, como Bélgica, basta con la sospecha para contabilizarlo como parte de la pandemia. Esta honestidad hace que sea uno de los países con más muertos per cápita.

Otro motivo de confusión son las fuentes utilizadas. En la mayoría de los países se contabilizan las muertes en hospitales y centros de salud, pero no en residencias de ancianos, ni se recogen los datos de las funerarias que tienen información de fallecimientos en las casas sin causa confirmada. Más aún, en el caso de España, las funerarias no están obligadas a dar sus datos; muchas residencias son de gestión privada y tampoco tienen porqué dar sus defunciones.

Cuando un país ha considerado estas fuentes han habido cambios brutales en los datos: aumentando en más de 4 mil los muertos en el Reino Unido o en más de 3 mil en Cataluña. Esto produce discontinuidades en las estadísticas que generan un problema adicional a la imprecisión que ya teníamos.

Para estimar el número real de fallecidos se están usando las diferencias de un año a otro en los registros civiles de cada país, ajustando el aumento poblacional, para ver si han habido cambios adicionales a los fallecidos informados y verificar si estos son estadísticamente significativos. Por ejemplo en España se estima que hay un 80% de fallecidos más.

Y si esta estadística –vital para calcular tasas de mortalidad y letalidad– no es igual en cada país, implica un caos adicional para la OMS. Una solución sería tener estándares mundiales de cómo decidir la causa de la muerte y que fuentes usar para contabilizarlas. 

LECCIÓN 4: Las paradojas temporales

Las lecciones anteriores enseñan que la pandemia es un proceso muy dinámico que depende de muchos factores, empezando por la educación cívica: basta con que cada enfermo infecte a más de una persona para que el contagio crezca de forma exponencial. Todo esto hace muy complejo modelar cómo progresa la epidemia en el tiempo.

Peor aún, cada día estamos viendo los efectos del virus en el pasado. Los fallecidos son personas que supimos que estaban enfermas 10 o más días atrás y los casos informados son de los test que se hicieron varias horas o días antes. El retardo depende del sistema de salud (público o privado), la disponibilidad del test y la ubicación geográfica (ya que, a veces, el test tiene que llevarse a donde hay laboratorios).

Sin embargo, también cada gobierno contempla posibles futuros. La experiencia de un país en un estadio más avanzado de la pandemia es útil para lidiar con nuestros datos ya obsoletos. Mientras más tarde ha llegado el virus, mejor es la bola de cristal. Así lo entendió muy bien Jacinta Ardern, primera ministra de Nueva Zelanda, que ni siquiera esperó a tener parte de los datos: decretó el cierre total de fronteras antes de la primera muerte. Por ello es uno de los pocos países que puede decir que tiene el virus casi erradicado.


Siete lecciones para lidiar con los datos de una pandemia
Parte I: Errores en la recogida de datos
Lección 1
Parte II: Caos para contabilizar los muertos
Lección 2,3,4
Parte III: La importancia de la transparencia
Lección 5,6
Parte IV: La obsesión por compararse
Lección 7
Ricardo Baeza-Yates es Ph.D. en Ciencia de la Computación y Director de Ciencia de Datos de Northeastern University en el Silicon Valley, además de investigador a tiempo parcial en universidades de Cataluña y Chile. Es Fellow de ACM e IEEE.
Karma Peiró es periodista especializada en Tecnologías de la Información y la Comunicación desde 1995. Sus intereses son la ética de la inteligencia artificial y la transparencia algorítmica.

 

Deja una respuesta

Su dirección de correo electrónico no será publicada.

El Periodista