Cómo predecir la incidencia de la gripe estacional juntando Inteligencia Artificial y Google Trends.


  • Médicos e Internet
El acceso al contenido completo es sólo para profesionales sanitarios registrados. El acceso al contenido completo es sólo para profesionales sanitarios registrados.

Conocer con tiempo suficiente cómo evoluciona una onda epidémica de gripe común o saber en tiempo real a cuántas personas está afectando es el deseo de cualquier responsable sanitario que sea consciente de las implicaciones que esta enfermedad acarrea cada año. Las campañas de vacunación se programan para unas fechas más o menos similares a la vuelta de cada verano, y desde los recursos de salud pública siempre se insiste en la conveniencia de mitigar los efectos de esta infección viral y aumentar los niveles de prevención ante ella. 

Desde un punto de vista de la asignación de recursos sanitarios, hay dos implicaciones muy importantes. Por una parte, las vacunas que hay que mantener accesibles y cuya disponibilidad depende de una sistema logístico complejo, que tienen su inicio cuando se determina la cepa predominante correspondiente al año -de la que habrá que producir el antígeno contenido en la vacuna-, pero que también implica complejos procedimientos de fabricación y distribución de las dosis necesarias. De otra parte, los servicios asistenciales sanitarios tienen que ser reforzados en época de gripe, porque es una patología que especialmente en determinados grupos de edad puede causar situaciones de gravedad. Las imágenes de las urgencias de los hospitales colapsadas en estos momentos del año son habituales.        

Por eso, está aceptado que conocer con precisión cuándo comienza y cuánto dura la fase de propagación anual del virus de la gripe y qué impacto epidémico va a tener podría ayudar tanto a los gestores como a los clínicos a mitigar su impacto económico, organizativo y, especialmente, el que afecta a la salud poblacional. Aunque es posible realizar pronósticos sobre zonas geográficas tomando como referencia lo que ocurre en otros territorios, no es todavía posible determinar con suficiente precisión y anticipación las magnitudes correspondientes a cada año y para localización concreta. 

Pero posiblemente estemos ahora en el inicio de poder crear modelos que nos ayuden a predecir esos picos epidémicos, y gracias a la combinación de herramientas como el análisis predictivo guiado por inteligencia artificial y la información que los propios ciudadanos transmiten en tiempo real mediante sus búsquedas en Internet. Igual que algunos sistemas sanitarios disponen de una llamada red de “médicos centinela”, dispuesta para generar avisos de la llegada de la epidemia según sus registros clínicos, ahora este nuevo sistema se puede hacer muchísimo más extenso y preciso.  

  

 

 

Saber lo que se busca en la red y poderlo analizar.

En un artículo recientemente publicado, titulado “Sequence to Sequence with Attention for Influenza Prevalence Prediction using Google Trends”, científicos de la Universidad de Tokio han dado a conocer un enfoque innovador que logró la predicción de las fechas y características de la temporada de gripe en varios estados de Estados Unidos. Aunque se trata de un abordaje muy preliminar, parece que la metodología de análisis podría ser válida.

¿En qué consiste este método? Básicamente en acceder a los resultado de una herramienta pública de Google, llamada Google Trends, que muestra los términos de búsqueda más populares de un periodo de tiempo concreto, que puede ser muy reciente, y que permite conocer mediante gráficas con cuánta frecuencia se realiza una búsqueda de un término particular en cualquier región del mundo o en los idiomas que queramos analizar. 

Este equipo de investigadores utilizó la herramienta de Google para medir el interés de las personas en la gripe en un momento dado, de acuerdo con las búsquedas que se hacían guiadas por la palabra "influenza". Es decir, emplearon a toda la población como testigos de algún tipo de preocupación o sospecha de tener enfermedad, lo que ocurre cuando se comienzan a sentir los pródromos, primeros síntomas, o estos están presentes en el entorno. 

A partir de esta información de partida, el equipo aprovechó un tipo de modelo de Inteligencia Artificial conocido como “Sequence to Sequence with Attention”, que procesa los datos que se le introducen de forma selectiva y en función de determinados criterios de agrupación. Como la mayoría de los sistemas de aprendizaje automático, este modelo forma capas de funciones matemáticas (llamadas neuronas) que elaboran los datos y los pasan a capas subsiguientes. 

 

 

El equipo utilizó datos sobre el porcentaje de personas infectadas con enfermedades similares a la gripe provenientes de fuentes oficiales en seis estados de EE.UU., concretamente de Nueva York, Oregón, California, Illinois, Texas y Georgia, que habían sido seleccionados por su diversidad climática. Los investigadores combinaron esas cifras con los datos de Google Trends específicos para cada estado entre el 10 de octubre de 2010 hasta el 30 de diciembre de 2018 (en total, 430 semanas). Alrededor del 67% de los datos se utilizó para entrenar el modelo de Inteligencia Artificial, y el otro 37% para probarlo.

Los coautores del artículo dicen que en las pruebas el modelo utilizado tuvo una correlación "significativamente alta" en relación con ambas variables (datos obtenidos de registros epidemiológicos vs. datos obtenidos de las búsquedas en Internet), lo que permite afirmar que en este caso son fenómenos que acontecen al mismo tiempo. 

El interés de este modelo retrospectivo es que permite validar un primer paso en el establecimiento de esa correlación, de manera que en el futuro se pueda usar incluso en tiempo real. Suponiendo que esta técnica sea validada definitivamente, sería posible obtener alertas muy precisas del acontecimiento del pico epidémico de la gripe sin necesidad de hacer otra cosa que juntar un sistema de análisis inteligente a las bases de datos de dominio público que Google ya ofrece. Además, es un sistema escalable y que podría emplearse en cualquier zona geográfica en la que hubiera un porcentaje relevante de personas conectadas al buscador.