Прорив ШІ розшифровує ДНК «темної матерії» за допомогою альфагенома

17

Десятиліттями вчені намагалися зрозуміти величезні ділянки некодуючої ДНК у наших геномах, яку часто називають «сміттєвою ДНК», оскільки вона не бере безпосередньої участі в синтезі білка. Тепер Google DeepMind представив AlphaGenome, нову модель штучного інтелекту, призначену для передбачення впливу цього таємничого генетичного матеріалу на здоров’я та хвороби. Це являє собою значний крок вперед у геноміці, потенційно відкриваючи розуміння того, як мутації впливають на експресію генів.

Прихована мова геному

Геном людини переважно складається з некодуючої ДНК: понад 98% — це ДНК, яка не транслюється в білки. Однак ця «темна матерія» регулює активність генів, визначаючи, чи клітини функціонують нормально чи хворіють. Проблема завжди полягала в тому, щоб передбачити як працюють ці некодуючі області — дотепер.

AlphaGenome аналізує послідовності ДНК довжиною до мільйона пар основ, оцінюючи, як мутації змінюють експресію генів. Це важливий крок, оскільки генетичні захворювання часто виникають через зміни в цих некодуючих областях, а не лише в генах, що кодують білки. Творці моделі виклали її у вільний доступ для наукового співтовариства.

На основі досягнень ШІ

AlphaGenome спирається на попередні прориви DeepMind у біології, керованій ШІ. Спершу з’явився AlphaFold, який точно передбачає структуру білка на основі амінокислотних послідовностей, що принесло його розробникам Нобелівську премію з хімії 2024 року. За цим послідував AlphaMissense, який зосереджувався на мутаціях у генах, що кодують білок. AlphaGenome поширює цю потужність на величезні простори без кодування, вирішуючи раніше нерозв’язну проблему.

«Уявіть, що у вас є величезна книга на три мільярди символів, і в ній щось пішло не так», — пояснює Пушміт Колі, віце-президент із науки DeepMind. «Альфагеном можна використовувати, щоб сказати: «Якщо ви зміните ці слова, який буде ефект?»»

Як працює AlphaGenome

Модель об’єднує дані з різних джерел, пов’язані з експресією генів, ідентифікацією закономірностей і прогнозуванням функціональних наслідків змін ДНК. Ключовою інновацією є його здатність обробляти надзвичайно довгі послідовності ДНК без втрати точності — обмеження попередніх інструментів. Це означає, що дослідники можуть вивчати цілі регуляторні регіони одночасно, а не збирати фрагментовані дані.

Потенційні програми

AlphaGenome ще не готовий для клінічного використання. Але його дослідницькі можливості величезні:
Розуміння хвороб: Виявлення мутацій, які викликають генетичні захворювання, включно з раком.
Генна терапія: Розробка більш ефективних методів лікування шляхом націлювання на правильні регуляторні сфери.
Геномні дослідження: Аналіз того, як геноми регулюють гени в різних клітинах і тканинах.
Рідкісні захворювання: Допомагає діагностувати рідкісні генетичні розлади, при яких мутації невідомі.

«За найкращими оцінками, AlphaGenome просунув [галузю] вперед», — каже Девід Келлі з Calico Life Sciences.

Обмеження та наступні кроки

AlphaGenome має обмеження. Він був навчений лише на геномах людини та миші і може не враховувати вплив на інші види. Модель також недосконала: вона може передбачити відсутність ефекту, коли він є. Дослідники працюють над покращенням передбачуваної здатності та кількісним визначенням невизначеності.

«Передбачити, як хвороба проявляється на основі геному, є надзвичайно складним завданням, і ця модель не може магічно передбачити це», — каже Жига Авсек, керівник відділу геномних досліджень у DeepMind. «Але AlphaGenome може звузити коло можливих мутацій, пов’язаних із хворобою, що робить його корисним для визначення пріоритетів досліджень».

AlphaGenome представляє поступовий, але реальний прогрес. Він не розгадає таємниці геному за одну ніч, але пропонує новий потужний інструмент для розгадки складнощів плану життя.