El Bid Data Institute de la Universidad de Oxford han dado un gran paso hacia el mapeo total de las relaciones genéticas entre humanos: una sola genealogía que rastrea la ascendencia de todos nosotros. El estudio ha sido publicado en Science.

Las últimas dos décadas han visto avances extraordinarios en la investigación genética humana, generando datos genómicos para cientos de miles de individuos, incluso de miles de personas prehistóricas. Esto plantea la emocionante posibilidad de rastrear los orígenes de la diversidad genética humana para producir un mapa completo de cómo los individuos de todo el mundo se relacionan entre sí.

Hasta ahora, los principales desafíos de esta visión eran encontrar una forma de combinar secuencias genómicas de muchas bases de datos diferentes y desarrollar algoritmos para manejar datos de este tamaño. Sin embargo, el nuevo método publicado por investigadores del Big Data Institue de la Universidad de Oxford puede combinar fácilmente datos de múltiples fuentes y escalar para acomodar millones de secuencias genómicas.

El doctor Yan Wong, genetista evolutivo del Big Data Institute y uno de los autores principales, explicó: "Básicamente, hemos construido un gran árbol genealógico, una genealogía para toda la humanidad que modela tan exactamente como podemos la historia que generó toda la variación genética que encontramos en los humanos hoy en día. Esta genealogía nos permite ver cómo la secuencia genética de cada persona se relaciona con las demás, a lo largo de todos los puntos del genoma". 
Dado que las regiones genómicas individuales sólo se heredan de un padre, ya sea la madre o el padre, la ascendencia de cada punto del genoma se puede considerar como un árbol. El conjunto de árboles, conocido como 'secuencia de árboles' o 'gráfico de recombinación ancestral', vincula las regiones genéticas a través del tiempo hasta los ancestros donde apareció por primera vez la variación genética.

El autor principal, el doctor Anthony Wilder Wohns, quien realizó la investigación como parte de su doctorado en el Big Data Institue y ahora es investigador posdoctoral en el Broad Institute del MIT y Harvard, dijo: "Esencialmente, estamos reconstruyendo los genomas de nuestros antepasados usándolos para formar una vasta red de relaciones. Entonces podemos estimar cuándo y dónde vivieron estos antepasados. El poder de nuestro enfoque es que hace muy pocas suposiciones sobre los datos subyacentes y también puede incluir muestras de ADN modernas y antiguas".

El estudio integró datos sobre genomas humanos modernos y antigos de ocho bases de datos diferentes e incluyó un total de 3.609 secuencias genómicas individuales de 215 poblaciones. Los genomas antiguso incluían muestras encontradas en todo el mundo con edades que oscilaban entre los mil y los más de cien mil años. Los algoritmos predijeron dónde deben estar presentes los ancestros comunes en los árboles evolutivos para explicar los patrones de variación genética. La red resultante contenía casi 27 millones de antepasados.

Después de agregar datos de ubicación en estos genomas de muestra, los autores usaron la red para estimar dónde habían vivido los anestros comunes predichos. Los resultados recuperaron con éxito eventos clave en la historia evolutiva humana, incluida la migración fuera de África. 
Aunque el mapa genealógico ya es un recurso extremadamente rico, el equipo de investigación planea hacerlo aún más completo al continuar incorporando datos genéticos a medida que estén disponibles. Debido a que las secuencias de árboles almacenan datos de manera muy eficiente, el conjunto de datos podría acomodra fácilmente millones de genomas adicionales. 

El doctor Wong dijo: "Este estudio está sentando las bases para la próxima generación de ADN. A media que mejore la calidad de las secuencias genómicas de las muestras de ADN modernas y antiguas, los árboles serán aún más precisos y eventualmente podremos generar un mapa único y unificado que explique el descenso de toda la variación genática humana que vemos hoy".

El doctor Wong agregó: "Si bien los humanos son el foco de este estudio, el método es válido para la mayoría de los seres vivos, desde los orangutanes hasta las bacterias. Podría ser particularmente beneficioso en genética médica, al separar las asociaciones verdaderas entre las regiones genéticas y las enfermedades de las falsas conexiones que surgen de nuestra historia ancestral compartida".