Durante décadas, os cientistas têm lutado para compreender as vastas extensões de DNA não codificante dentro dos nossos genomas – muitas vezes chamado de “DNA lixo” porque não constrói proteínas diretamente. Agora, o Google DeepMind revelou o AlphaGenome, um novo modelo de inteligência artificial projetado para prever como esse misterioso material genético influencia a saúde e as doenças. Isto representa um avanço significativo na genómica, potencialmente revelando insights sobre como as mutações impactam a expressão genética.
A linguagem oculta do genoma
O genoma humano é esmagadoramente não codificante, com mais de 98% consistindo de DNA que não se traduz em proteínas. No entanto, esta “matéria escura” regula a actividade genética, determinando se as células funcionam correctamente ou ficam doentes. O desafio sempre foi prever como essas regiões não codificadas funcionam – até agora.
AlphaGenome analisa sequências de DNA com até um milhão de pares de bases, avaliando como as mutações alteram a expressão genética. Este é um passo crucial porque as doenças genéticas muitas vezes resultam de alterações nestas regiões não codificantes, e não apenas nos genes codificadores de proteínas. Os criadores do modelo disponibilizaram-no gratuitamente para a comunidade científica mais ampla.
Baseando-se nos sucessos da IA
AlphaGenome baseia-se nos avanços anteriores da DeepMind em biologia alimentada por IA. Primeiro veio o AlphaFold, que prevê com precisão estruturas de proteínas a partir de sequências de aminoácidos, rendendo a seus desenvolvedores o Prêmio Nobel de Química em 2024. Depois veio o AlphaMissense, com foco em mutações que codificam proteínas. AlphaGenome estende esse poder ao vasto espaço não codificado, abordando um problema anteriormente intratável.
“É como se você tivesse um livro enorme de três bilhões de caracteres e algo errado acontecesse neste livro”, explica Pushmeet Kohli, vice-presidente de ciência da DeepMind. “AlphaGenome pode ser usado para dizer: ‘Se você mudar essas palavras, qual seria o efeito?’”
Como funciona o AlphaGenome
O modelo combina dados de múltiplas fontes relacionadas à expressão genética, identificando padrões e prevendo as consequências funcionais das alterações no DNA. Uma inovação importante é a sua capacidade de lidar com sequências de DNA extremamente longas sem sacrificar a precisão – uma limitação das ferramentas anteriores. Isto significa que os investigadores podem estudar regiões reguladoras inteiras de uma só vez, em vez de reunir dados fragmentados.
Aplicações potenciais
AlphaGenome ainda não está pronto para uso clínico. Mas suas aplicações em pesquisa são vastas:
– Compreendendo as doenças: Identificando mutações que causam doenças genéticas, incluindo o câncer.
– Terapia genética: Projetar tratamentos mais eficazes visando as regiões regulatórias corretas.
– Estudos de todo o genoma: analisando como os genomas regulam genes em diferentes células e tecidos.
– Condições Raras: Ajuda a diagnosticar doenças genéticas raras em que as mutações subjacentes são desconhecidas.
“Apesar de todas as melhores avaliações que temos, o AlphaGenome parece ter avançado um pouco [o campo]”, diz David Kelley, da Calico Life Sciences.
Advertências e etapas futuras
AlphaGenome tem limitações. Ele foi treinado apenas em genomas humanos e de camundongos e pode não ter efeitos em outras espécies. O modelo também é imperfeito; pode prever nenhum efeito quando existe. Os pesquisadores estão trabalhando para melhorar o poder preditivo e quantificar a incerteza.
“Prever como uma doença se manifesta a partir do genoma é um problema extremamente difícil, e este modelo não é capaz de prever isso magicamente”, diz Žiga Avsec, líder de genômica da DeepMind. “Mas o AlphaGenome pode restringir o conjunto de possíveis mutações envolvidas numa doença, tornando-o útil para priorizar a investigação.”
AlphaGenome representa um progresso incremental, mas real. Não resolverá os mistérios do genoma da noite para o dia, mas oferece uma nova ferramenta poderosa para desvendar as complexidades do projeto da vida.

















