Durante décadas, los científicos han luchado por comprender las vastas extensiones de ADN no codificante dentro de nuestros genomas, a menudo llamado “ADN basura” porque no construye proteínas directamente. Ahora, Google DeepMind ha presentado AlphaGenome, un nuevo modelo de inteligencia artificial diseñado para predecir cómo este misterioso material genético influye en la salud y la enfermedad. Esto representa un importante avance en la genómica y podría revelar información sobre cómo las mutaciones afectan la expresión genética.
El lenguaje oculto del genoma
El genoma humano es abrumadoramente no codificante, y más del 98% está formado por ADN que no se traduce en proteínas. Sin embargo, esta “materia oscura” regula la actividad genética, determinando si las células funcionan correctamente o enferman. El desafío siempre ha sido predecir cómo funcionan estas regiones no codificantes, hasta ahora.
AlphaGenome analiza secuencias de ADN de hasta un millón de pares de bases de largo, evaluando cómo las mutaciones alteran la expresión genética. Este es un paso crucial porque las enfermedades genéticas a menudo surgen de cambios en estas regiones no codificantes, no sólo en los genes que codifican proteínas. Los creadores del modelo lo han puesto a disposición de la comunidad investigadora de forma gratuita.
Aprovechar los éxitos de la IA
AlphaGenome se basa en los avances anteriores de DeepMind en biología impulsada por IA. Primero vino AlphaFold, que predice con precisión las estructuras de las proteínas a partir de secuencias de aminoácidos, lo que le valió a sus desarrolladores el Premio Nobel de Química en 2024. Luego vino AlphaMissense, que se centra en las mutaciones que codifican las proteínas. AlphaGenome extiende este poder al vasto espacio no codificante, abordando un problema que antes era intratable.
“Es como si tuvieras un libro enorme de tres mil millones de caracteres y algo malo sucediera en él”, explica Pushmeet Kohli, vicepresidente de ciencia de DeepMind. “AlphaGenome se puede utilizar para decir: ‘Si cambias estas palabras, ¿cuál sería el efecto?'”
Cómo funciona AlphaGenome
El modelo combina datos de múltiples fuentes relacionadas con la expresión genética, identificando patrones y prediciendo las consecuencias funcionales de los cambios en el ADN. Una innovación clave es su capacidad para manejar secuencias de ADN extremadamente largas sin sacrificar la precisión, una limitación de las herramientas anteriores. Esto significa que los investigadores pueden estudiar regiones regulatorias enteras a la vez, en lugar de reunir datos fragmentados.
Aplicaciones potenciales
AlphaGenome aún no está listo para uso clínico. Pero sus aplicaciones de investigación son enormes:
– Comprensión de las enfermedades: Identificar las mutaciones que provocan enfermedades genéticas, incluido el cáncer.
– Terapia génica: Diseño de tratamientos más eficaces dirigiéndose a las regiones reguladoras correctas.
– Estudios de todo el genoma: Analizar cómo los genomas regulan genes en diferentes células y tejidos.
– Condiciones raras: Ayuda a diagnosticar trastornos genéticos raros donde se desconocen las mutaciones subyacentes.
“A pesar de las mejores evaluaciones que tenemos, parece que AlphaGenome hizo avanzar [el campo] un poco”, dice David Kelley de Calico Life Sciences.
Advertencias y pasos futuros
AlphaGenome tiene limitaciones. Fue entrenado únicamente con genomas humanos y de ratón y puede pasar por alto efectos en otras especies. El modelo también es imperfecto; podría predecir que no habrá ningún efecto cuando exista uno. Los investigadores están trabajando para mejorar el poder predictivo y cuantificar la incertidumbre.
“Predecir cómo se manifiesta una enfermedad a partir del genoma es un problema extremadamente difícil, y este modelo no es capaz de predecirlo mágicamente”, dice Žiga Avsec, líder de genómica de DeepMind. “Pero AlphaGenome puede reducir el conjunto de posibles mutaciones implicadas en una enfermedad, lo que lo hace útil para priorizar la investigación”.
AlphaGenome representa un progreso incremental pero real. No resolverá los misterios del genoma de la noche a la mañana, pero ofrece una nueva y poderosa herramienta para desentrañar las complejidades del modelo de la vida.

















