La tecnología está experimentando una evolución vertiginosa en todos los campos, y la biología molecular no es una excepción. Un hito revolucionario ha sido alcanzado recientemente con el uso de inteligencia artificial para diseñar fragmentos de ADN que regulan genes en células sanas de mamíferos por primera vez. Este avance no solo abre puertas para el desarrollo de terapias génicas más precisas y personalizadas, sino que también representa un paso significativo en la biología generativa al crear elementos reguladores sintéticos nunca antes vistos en la naturaleza. El estudio, realizado por un equipo del Centro de Regulación Genómica (CRG) en Barcelona, ha sido publicado en la reconocida revista Cell y describe cómo la IA puede redactar las secuencias de ADN necesarias para controlar la actividad de genes específicos en determinados tipos celulares. A diferencia de las técnicas convencionales que dependen de regiones naturales del genoma, esta nueva herramienta genera secuencias reguladoras creadas desde cero, con propiedades exactas y en función de necesidades concretas.
Es como programar software biológico para interferir con el funcionamiento interno de una célula con la máxima precisión. El mecanismo detrás de esta innovación radica en una inteligencia artificial generativa desarrollada para entender y reproducir el «lenguaje» del ADN que controla la expresión génica. En particular, se enfoca en diseñar potenciadores, pequeños fragmentos de ADN que pueden activar o desactivar la actividad de un gen. Tradicionalmente, la búsqueda de estos potenciadores se ha limitado a las secuencias que la evolución ha generado, mientras que el modelo de IA rompe esa barrera y propone nuevos códigos que la naturaleza aún no ha creado. Una de las ventajas cruciales radica en la personalización de estos reguladores genéticos.
Por ejemplo, el modelo puede diseñar fragmentos de ADN que activen un gen solamente en células madre que se diferenciarán en glóbulos rojos, pero no en plaquetas, permitiendo un control extremadamente fino sobre qué genes se encienden y en qué tipos celulares. Esto tiene un potencial transformador para el desarrollo de terapias génicas específicas, que pueden aumentar o disminuir la expresión genética solo en los tejidos que lo requieren, reduciendo así efectos secundarios y aumentando la eficacia de los tratamientos. El equipo del CRG combinó biología molecular, aprendizaje automático y síntesis química para llevar a cabo un experimento sólido y representativo. Primero, diseñaron miles de secuencias sintéticas de ADN, cada una de aproximadamente 250 letras (A, T, C, G), que fueron luego sintetizadas químicamente e introducidas en células sanguíneas de ratón mediante vectores virales. Posteriormente, analizaron el comportamiento de estas secuencias, observando que la regulación génica ocurrió como se había previsto, activando genes específicos de manera controlada y sin afectar otros.
Este éxito se apoya en la creación de una base de datos masiva a partir de cinco años de experimentos, donde más de 64,000 potenciadores sintéticos fueron diseñados y analizados en diferentes etapas del desarrollo de células sanguíneas. Los investigadores estudiaron la combinación y posición de sitios de unión para 38 factores de transcripción, proteínas clave para regular la actividad genética. Además, a diferencia de investigaciones previas que se basaban en líneas celulares cancerígenas para facilidad experimental, esta investigación se enfocó en células sanas, ofreciendo resultados más representativos de la biología humana normal. Los hallazgos sorprendieron a los científicos en cuanto a la dinámica de los potenciadores. La mayoría actuaban como reguladores de intensidad similar a un control de volumen, modulando la expresión génica de forma gradual.
Sin embargo, algunos combinaciones exhibían un comportamiento de encendido/apagado conocido como “sinergia negativa”, donde dos factores que normalmente activan un gen por separado, al unirse, lo reprimen efectivamente. Este fenómeno subraya la complejidad y precisión que pueden alcanzar estas secuencias sintéticas diseñadas por IA. Gracias a los datos obtenidos, el modelo de inteligencia artificial fue entrenado para crear nuevas secuencias de potenciadores capaces de generar patrones específicos de actividad génica. Las predicciones del modelo se confirmaron experimentalmente, evidenciando que la IA no sólo diseñó moléculas funcionales, sino que logró innovar con combinaciones genéticas que no existían en la naturaleza, ampliando las posibilidades del diseño genómico. La magnitud del trabajo desarrollado por el equipo del CRG es impresionante.
No solamente logró superar una barrera técnica histórica al diseñar eficientemente potenciadores sintéticos, sino que también estableció un paradigma para la biología generativa, una disciplina emergente que busca crear nuevos componentes biológicos mediante algoritmos avanzados. Hasta ahora, gran parte del progreso en la biología computacional había estado centrado en diseñar proteínas, enzimas y anticuerpos. La incorporación de la regulación genética en este ámbito multiplica las rutas hacia terapias innovadoras. El impacto de esta investigación es especialmente prometedor en el campo de la terapia génica, donde el principal reto ha sido lograr un control específico y seguro de la expresión génica. Muchas enfermedades derivan de desregulaciones en la expresión de genes en tipos celulares particulares, por lo que contar con la capacidad de diseñar potenciadores que actúen exclusivamente en esas células abre una vía para terapias mucho más efectivas y con menor riesgo de efectos colaterales.
Además, la personalización del diseño genético ofrece una oportunidad para tratamientos adaptados a las características individuales del paciente, acercando la medicina hacia una verdadera era de la medicina de precisión. Los posibles escenarios de aplicación incluyen desde trastornos hematológicos hasta enfermedades neurodegenerativas o cáncer, donde la manipulación precisa del genoma puede marcar una diferencia decisiva. El avance también plantea interrogantes sobre el futuro de la investigación en biología y bioinformática. La disponibilidad de grandes volúmenes de datos experimentales y herramientas de aprendizaje automático permiten no solo entender sino también crear nuevas formas moleculares con funciones biológicas. Sin embargo, es fundamental continuar explorando la complejidad de la regulación genética y los múltiples factores que influyen en ella para poder ampliar el espectro de aplicaciones prácticas.