Десятилетиями ученые пытались понять огромные участки некодирующей ДНК в наших геномах, часто называемые «мусорной ДНК», поскольку она не участвует в непосредственном синтезе белков. Теперь Google DeepMind представила AlphaGenome, новую модель искусственного интеллекта, предназначенную для прогнозирования влияния этого загадочного генетического материала на здоровье и болезни. Это представляет собой значительный скачок в геномике, потенциально открывая понимание того, как мутации влияют на экспрессию генов.
Скрытый Язык Генома
Человеческий геном подавляюще состоит из некодирующей ДНК: более 98% — это ДНК, которая не транслируется в белки. Тем не менее, эта «тёмная материя» регулирует активность генов, определяя, нормально ли функционируют клетки или становятся больными. Проблема всегда заключалась в предсказании того, как работают эти некодирующие области — до сих пор.
AlphaGenome анализирует последовательности ДНК длиной до одного миллиона пар оснований, оценивая, как мутации изменяют экспрессию генов. Это решающий шаг, поскольку генетические заболевания часто возникают из-за изменений в этих некодирующих регионах, а не только в кодирующих белком генах. Создатели модели сделали ее свободно доступной для научного сообщества.
Основано на Успехах ИИ
AlphaGenome основывается на предыдущих прорывах DeepMind в области биологии, основанной на ИИ. Сначала появилась AlphaFold, точно предсказывающая структуры белков из аминокислотных последовательностей, что принесло ее разработчикам Нобелевскую премию по химии в 2024 году. Затем последовала AlphaMissense, фокусирующаяся на мутациях в кодирующих белком генах. AlphaGenome расширяет эту мощность на огромные некодирующие пространства, решая ранее неразрешимую проблему.
«Представьте, что у вас есть огромная книга из трех миллиардов символов, и в этой книге что-то пошло не так», — объясняет Пушмит Кохли, вице-президент по науке DeepMind. «AlphaGenome можно использовать, чтобы сказать: ‘Если вы измените эти слова, какой будет эффект?'»
Как Работает AlphaGenome
Модель объединяет данные из различных источников, связанных с экспрессией генов, выявляя закономерности и предсказывая функциональные последствия изменений ДНК. Ключевое нововведение заключается в ее способности обрабатывать чрезвычайно длинные последовательности ДНК без потери точности — ограничение предыдущих инструментов. Это означает, что исследователи могут изучать целые регуляторные области сразу, вместо того чтобы собирать фрагментированные данные.
Потенциальные Применения
AlphaGenome пока не готов к клиническому применению. Но его исследовательские возможности огромны:
— Понимание Заболеваний: Выявление мутаций, вызывающих генетические заболевания, включая рак.
— Генная Терапия: Разработка более эффективных методов лечения путем воздействия на правильные регуляторные области.
— Геномные Исследования: Анализ того, как геномы регулируют гены в разных клетках и тканях.
— Редкие Заболевания: Помощь в диагностике редких генетических расстройств, где основные мутации неизвестны.
«Судя по всем лучшим оценкам, AlphaGenome продвинула [область] вперед», — говорит Дэвид Келли из Calico Life Sciences.
Ограничения и Следующие Шаги
AlphaGenome имеет ограничения. Он был обучен только на геномах человека и мыши и может не учитывать эффекты в других видах. Модель также несовершенна: она может предсказать отсутствие эффекта, когда он существует. Исследователи работают над улучшением прогностической силы и количественной оценкой неопределенности.
«Предсказать, как проявляется заболевание из-за генома, — чрезвычайно сложная задача, и эта модель не может волшебным образом это предсказать», — говорит Жига Авсец, руководитель геномных исследований DeepMind. «Но AlphaGenome может сузить круг возможных мутаций, связанных с заболеванием, что делает его полезным для приоритезации исследований.»
AlphaGenome представляет собой постепенный, но реальный прогресс. Он не решит загадки генома в одночасье, но предлагает мощный новый инструмент для разгадывания сложностей чертежа жизни.
