Científicos españoles crean la primera base de datos con las variables genéticas de la población española

  • Andrea Arnal

  • Noticias
El acceso al contenido completo es sólo para profesionales sanitarios registrados. El acceso al contenido completo es sólo para profesionales sanitarios registrados.

Uno de los aspectos que más urgen en medicina colaborativa es conocer la variabilidad genética de la población local, porque, entre otras cosas, ayuda a descartar más rápidamente enfermedades en el proceso de diagnóstico de pacientes con una dolencia desconocida. Los datos de variabilidad ya existen en España, pero hasta ahora se han encontrado diseminados entre diversos proyectos genómicos locales o reservados para otros fines. Gracias al trabajo conjunto de científicos españoles procedentes de diversos centros de investigación, se ha presentado el Servidor Colaborativo de Variabilidad Española (CSVS, por sus siglas en inglés: Collaborative Spanish Variability Server), un repositorio en abierto con más de 2.000 genomas y exomas de individuos españoles no emparentados: “Por primera vez, tenemos frecuencias bastante decentes y razonables de variación genética de la población española”, anuncia a Univadis España Joaquín Dopazo, investigador del CIBERER, y uno de los principales coordinadores del proyecto.

Esta herramienta forma parte de las llamadas tecnologías de secuenciación, que han ayudado a conocer mejor las mutaciones relacionadas con enfermedades, sobre todo de aquellas en las que existe una elevada morbilidad y mortalidad. A día de hoy, más de 4.500 enfermedades monogénicas (causadas por la mutación de un solo gen) pueden ser diagnosticadas directamente mediante genómica personalizada, posibilidad que podría aplicarse en un futuro cercano a todo el espectro de enfermedades raras de origen genético. 

Por eso esta nueva herramienta de diagnóstico es tan interesante. En palabras de Dopazo, “ahorrará tiempo” a los médicos que atienden a pacientes con mutaciones desconocidas, al poderse filtrar más rápidamente las variantes genéticas relacionadas con la población y descartar posibles enfermedades en el proceso de cribado: “El CSVS te ayuda en el proceso de priorización, es decir, en la parte de filtrado que tiene que ver con la frecuencia de la población española”. 

La herramienta funciona con secuencias agrupadas por categorías superiores CIE10 (clasificación internacional de las enfermedades), de modo que a través de la web se puede consultar la base de datos eliminando una o más categorías de dicha clasificación. Así, se obtienen recuentos de variantes en genomas de la población española sana que servirían como pseudocontroles para estudios de búsqueda de nuevos genes e incluso algunos estudios poblacionales como, por ejemplo, la prevalencia de variantes farmacogenómicas.

Esta forma de enfoque, en la que los pacientes con ciertas enfermedades pueden ser vistos como ‘sanos’ en relación a otro grupos de enfermos, es precisamente uno de los aspectos a destacar de la iniciativa. Los investigadores de este proyecto explican que por norma general se tiende a secuenciar principalmente los genomas de personas con alguna enfermedad y no de personas sanas. Sin embargo, precisan, “es necesario contar con la información genómica de los pacientes sanos para discriminar e identificar nuevas variantes genómicas de las enfermedades”. Para solucionar este problema, la iniciativa parte de una idea “muy útil y original”, según Dopazo, que consiste en utilizar secuencias de enfermos como controles sanos: “Si tú estás estudiando una distrofia retinal, para ti una persona que tiene una cardiopatía es sana con respecto a la ceguera, y viceversa. Con lo cual, si tú estás estudiando una enfermedad, puedes quitar ese grupo en la base de datos, y el resto son controles sanos para ti”, ejemplifica.

Los detalles del proyecto han sido publicados en la revista Nucleic Acids Research, liderado por investigadores del Área de Bioinformática Clínica del Sistema Sanitario Público de Andalucía y del Centro de Investigación Biomédica en Red de Enfermedades Raras (CIBERER), que trabajan en el marco de la Plataforma de Bioinformática para las Enfermedades Raras (BIER) de este centro. También han contribuido diferentes consorcios y proyectos en el suministro de las secuencias, como el Proyecto de Enfermedades No Diagnosticadas (ENoD) del CIBERER, Proyecto Genoma 1.000 Navarra o la red Rare Genomics de Madrid, entre otros. 

De momento, la base de datos contiene un total de 2.027 genomas y exomas de individuos españoles no emparentados, pero al ser una iniciativa de crowdsourcing, la idea es que todo aquel que lo desee colabore en su agrandamiento: “Una vez que las secuencias son mandadas a la plataforma, son comprobadas por miembros del proyecto para garantizar que son válidas y que cumplen dos requisitos fundamentales: que son de población española, y que comparten, como mucho, 6º grado de consanguinidad (primos segundos, por ejemplo)”, detalla el experto. 

Que sea una iniciativa de crowdsourcing es otra novedad, pues hasta ahora no se había empleado esta forma de trabajo en la elaboración de base de datos local de variabilidad genética. El término viene del inglés, y es el resultado de las palabras crowd (multitud) y outsourcing (recursos externos) que hace alusión a una actividad participativa, generalmente convocada con ayuda de las nuevas tecnologías (fundamentalmente internet). A través de este procedimiento, una persona, institución, organización sin ánimo de lucro o empresa, propone a un grupo de individuos, mediante una convocatoria abierta y flexible, la realización libre y voluntaria de una tarea: “Los médicos que se dedican al diagnóstico han aportado unas tres cuartas partes de las secuencias, pero la plataforma está abierta para que colabore todo aquel que lo desee”. señala Dopazo. En este sentido, el SCVE es el primer repositorio local de variabilidad producido enteramente por un esfuerzo de crowdsourcing y constituye un ejemplo para futuras iniciativas en otros países para caracterizar la variabilidad local en todo el mundo.