La comprensión de la historia evolutiva humana representa uno de los pilares fundamentales en la genética y antropología moderna. Los descubrimientos recientes han demostrado que la evolución de los humanos modernos no es una línea simple y continua, sino que involucra eventos complejos de divergencias, mezclas y cambios en el tamaño poblacional. En este sentido, un innovador modelo coalescente estructurado ha arrojado luz sobre una antigua división y posterior recombinación en la ancestría humana, revelando una estructura ancestral profunda compartida por todas las poblaciones actuales. Para entender la importancia de este hallazgo, es necesario adentrarse en algunos conceptos de genética de población. La coalescencia se refiere al proceso retrospectivo a través del cual dos o más secuencias genéticas comparten un ancestro común.
Tradicionalmente, muchos modelos asumen un ancestro común dentro de una población panmítica, es decir, una población homogénea sin estructura subyacente. Sin embargo, estos modelos pueden pasar por alto complejas interacciones históricas, como divisiones poblacionales y eventos de mezcla. El modelo coalescente estructurado ayuda a capturar esta complejidad al permitir la existencia de poblaciones ancestrales subdivididas que divergen y se vuelven a juntar, proporcionando una herramienta más adecuada para estudiar la evolución humana profunda. La introducción del modelo coalescente estructurado, denominado "cobraa", representa un avance significativo. Cobraa es un modelo oculto de Markov basado en la coalescencia que permite representar explícitamente eventos ancestrales de división y remezcla poblacional.
Mediante su aplicación a datos genómicos de gran cobertura de ADN humano moderno y simulado, ha identificado que la historia que subyace en el genoma humano moderno contiene una estructura ancestral persistente durante aproximadamente un millón y medio de años. Con esta metodología se detectó que hace cerca de 1,5 millones de años, existieron dos poblaciones ancestrales humanas que se separaron y posteriormente volvieron a mezclarse hace unos 300 mil años en una proporción aproximada del 80% y 20% de contribución genética. Este evento de admixtura sugiere que todos los humanos actuales comparten esta historia común y compleja en su composición genética. El hallazgo de una fase prolongada de estructura poblacional previa a la admixtura desafía la hipótesis previamente dominante de una evolución humana sin subdivisiones profundas en el pasado remoto. Además, el análisis reveló un fuerte cuello de botella en la población mayoritaria tras la divergencia, un fenómeno que implica una drástica reducción temporal en el tamaño efectivo de esa población.
Los cuellos de botella tienen consecuencias significativas para la diversidad genética y evolución, amplificando el efecto de la deriva genética y modificando los patrones de variación observados en el ADN. Un aspecto relevante derivado de este trabajo es la identificación de regiones genómicas derivadas de cada una de las poblaciones ancestrales. El segmento genético proveniente de la población minoritaria mostró correlaciones con regiones cercanas a secuencias codificantes y señales de selección negativa, lo que sugiere que ciertas variantes provenientes de esta línea ancestría tuvieron efectos deletéreos en el contexto del genoma predominante y fueron suprimidas a lo largo del tiempo. Por otro lado, las regiones de ascendencia mayoritaria se asociaron estrechamente con la divergencia observada entre humanos y sus parientes arcaicos, como los neandertales y denisovanos. Esto implica que esta población mayoritaria fue también la progenitora principal de estos homínidos arcaicos.
Este hallazgo aporta claridad sobre la compleja red de relaciones genéticas entre los ancestros humanos modernos y sus parientes extintos, validando el modelo estructurado como una representación fiel de la historia evolutiva. Cobraa supera una limitación importante de métodos anteriores, como el PSMC (Coalescencia Secuencial de Markov Pareada), que asumen una población panmítica sin estructura. Resultó que dos modelos pueden presentar perfiles idénticos de tasa de coalescencia, uno estructurado y otro no, dificultando la identificación precisa del pasado demográfico. Sin embargo, el análisis de las distribuciones condicionales de tiempos de coalescencia entre posiciones vecinas en el genoma provee suficiente información para distinguir entre estos modelos, algo que cobra relevancia en estudios que exploran eventos ancestrales complejos. En simulaciones exhaustivas, se demostró que cobraa puede recuperar con buena precisión parámetros clave del modelo estructurado, como la fracción de admixtura y los tiempos de división y mezcla, incluso en situaciones con bajas proporciones de mezcla.
Esta robustez potencia su utilidad para el estudio detallado de las historias evolutivas complejas en diversas especies, y no sólo en humanos. La aplicación de cobraa a muestras genómicas de 26 poblaciones de todo el mundo, provenientes de proyectos genómicos globales como el 1000 Genomes Project y el Human Genome Diversity Project, corroboró los hallazgos derivados de simulaciones. Un análisis concordante de estas poblaciones mostró un ajuste significativamente mejor del modelo estructurado frente al modelo panmítico continuo, consolidando la idea de una profunda estructura ancestral común a todos los humanos modernos. Un aspecto innovador fue la extensión del modelo a cobraa-path, que permite inferir los segmentos genómicos provenientes de cada población ancestral en los individuos modernos mediante decodificación posterior. Esto abrió la posibilidad de mapear regiones enriquecidas o empobrecidas en material genético de la población minoritaria, detectando indicios de selección natural que moldearon el mosaico genómico actual.
Además, mediante análisis funcionales, se encontró un enriquecimiento en genes relacionados con el desarrollo neuronal y la señalización sináptica en las regiones con mayor aporte de la línea minoritaria, mientras que las regiones empobrecidas en admixtura mostraban una baja incidencia en genes asociados con respuestas inmunitarias adaptativas y función sensorial. Estos patrones sugieren que la admixtura ancestral pudo influir en características biológicas específicas y procesos evolutivos relacionados con la neurología y la inmunología. La relación entre las poblaciones A (mayoritaria) y B (minoritaria) con los neandertales y denisovanos fue analizada por medio de la comparación de divergencia genética en regiones asignadas a cada linaje. Se confirmo que la ascendencia A está más próxima a los genomas arcaicos, lo que implica que fueron los principales ancestros de estas poblaciones extintas, mientras que la ascendencia B se muestra más diferenciada. Más allá de humanos, el modelo cobraa fue aplicado a otras especies, como murciélagos, delfines, chimpancés y gorilas.
Los resultados variaron, con especies como el murciélago mostrando poca evidencia de estructura ancestral profunda, mientras que el delfín y algunos primates presentaban señales de eventos de estructura y admixtura, aunque en distintos momentos históricos y con parámetros propios. Esto evidencia la versatilidad del modelo para captar la complejidad de la historia evolutiva en distintas ramas del árbol de la vida. Las implicaciones de estos descubrimientos son profundas. El modelo estructurado sugiere que la evolución humana está marcada por una mezcla antigua entre poblaciones divergiendo hace más de un millón de años, probablemente relacionadas con linajes fósiles como Homo erectus y Homo heidelbergensis, y con impactos fisiológicos y adaptativos hasta la actualidad. Además, la admixtura ocurrida hace aproximadamente 300 mil años se alinea con la evidencia fósil de la aparición de los primeros humanos anatómicamente modernos, situando esta remezcla como un evento crucial en la formación de nuestra especie.
Sin embargo, se reconocen ciertas limitaciones. El modelo asume un evento puntual de admixtura y aislamiento posterior, mientras la verdadera historia puede ser más compleja, con gene flow continuo o múltiples eventos no modelados. Además, las suposiciones de neutralidad y tasas constantes de mutación y recombinación simplifican procesos biológicos que en realidad varían. En el contexto más amplio, estos resultados complementan y amplían estudios que detectan señales de introgresión más recientes provenientes de linajes arcaicos desconocidos, especialmente en África, y aportan una base genética para propuestas de un origen humano en poblaciones subdivididas y dinámicas. El desarrollo de cobraa representa un progreso metodológico que permite superar problemas clásicos de idoneidad en la inferencia demográfica a partir de genomas individuales, incrementando la capacidad para detectar y cuantificar estructuras ancestrales en épocas remotas.
La integración futura de datos adicionales, como espectros de frecuencia alelica y genealogías ancestrales, promete ofrecer aún mayor resolución. En suma, la identificación de una profunda estructura ancestral común en los humanos modernos redefine nuestra comprensión de la historia evolutiva, subrayando la importancia de eventos antiguos de divergencia y remezcla que han dejado una huella genética indeleble en nuestro genoma. Este trabajo abre nuevas vías para conectar las evidencias genéticas con el registro fósil y paleoclimático, profundizando el relato sobre quiénes somos y de dónde venimos.