Натхненний ChatGPT, Google DeepMind передбачає 71 мільйон генетичних мутацій! AI розшифровує генетичний код генів людини в Science

Перше джерело: Xinzhiyuan

Джерело зображення: створено Unbounded AI‌

Після того, як модель прогнозування білка AlphaFold викликала хвилю рівня цунамі у світі штучного інтелекту, сімейство Alpha відкрило нову вискочку.

Сьогодні Google DeepMind випустив нову модель AI AlphaMissense, яка може передбачити 71 мільйон «міссенс-мутацій».

Зокрема, з 89% «міссенс-мутацій», успішно передбачених AlphaMissense, 57% були патогенними, а 32% — доброякісними.

Адреса паперу:

Лише 0,1% мутацій можуть бути підтверджені експертами.

Щоб дослідники могли краще зрозуміти його можливий вплив, Google також оприлюднив увесь каталог десятків мільйонів «міссенс-мутацій».

Виявлення основної причини довгий час було однією з найбільших проблем у генетиці людини.

Місенс-мутації — це генетичні мутації, які можуть впливати на функцію «людських білків» і призводити до таких захворювань, як муковісцидоз, серповидно-клітинна анемія та рак.

Народження AlphaMissense демонструє величезний потенціал ШІ в галузі медицини, особливо в генетиці.

Це має велике значення для розуміння зв’язку між генетичними варіаціями та захворюваннями та розробки цільових лікарських засобів.

Слідом за AlphaFold AlphaMissense може стати штучним інтелектом, який зможе змінити світ і, як очікується, подолає проблеми людської генетики!

**Що таке «міссенс-мутація»? **

Місенс-мутація — це генетична мутація, яка використовується в біомедицині та молекулярній біології для опису генів, що кодують білок:

Заміна однієї букви в ДНК призводить до появи іншої амінокислоти в білку.

Якщо розглядати ДНК як мову, то заміна однієї літери може змінити слово та повністю змінити значення речення.

У цьому випадку зміни в ДНК призводять до змін амінокислот, які впливають на функцію білка.

Середня людина є носієм понад 9000 міссенс-мутацій.

Загалом кажучи, більшість із цих міссенс-мутацій є доброякісними та незначно впливають на організм людини. Але інші є патогенними і можуть серйозно порушити функцію білка.

Місенс-мутації можна використовувати для діагностики рідкісних генетичних захворювань, оскільки кілька або навіть одна міссенс-мутація можуть безпосередньо викликати захворювання.

Крім того, вони важливі для вивчення складних захворювань, таких як діабет ІІ типу, який може бути спричинений багатьма різними типами генетичних варіантів.

Тому класифікація місенс-мутацій є важливим кроком у розумінні того, які зміни білка можуть сприяти розвитку захворювання.

З понад 4 мільйонів міссенс-мутацій, які з’явилися у людей, лише 2% були названі експертами як патогенні або доброякісні.

Це становить лише близько 0,1% від усіх можливих 71 мільйона міссенс-мутацій.

Решта мутацій були класифіковані як «мутації невідомого значення» через відсутність експериментальних або клінічних даних щодо відповідних ефектів.

Але з AlphaMissense ми отримали найчіткіше зображення наслідків мутації:

AlphaMissense може класифікувати 89% мутацій із пороговою точністю 90% у базі даних відомих хворобливих мутацій.

Створено на основі AlphaFold, на основі великої моделі ChatGPT

Отже, як саме побудований AlphaMissense?

З моменту свого випуску AlphaFold і AlphaFold 2 передбачили структуру майже всіх білків, відомих науці, за їх амінокислотними послідовностями, понад 200 мільйонів білків.

У зв’язку з цим дослідники Google адаптували модель на основі AlphaFold (далі – AF), щоб вони могли передбачити патогенність місенс-мутацій, які змінюють одну амінокислоту в білку.

Простіше кажучи, весь принцип роботи AlphaMissense полягає в тому, щоб взяти амінокислотну послідовність як вхідні дані та передбачити патогенність усіх можливих окремих амінокислотних змін у певній позиції в послідовності.

Щоб навчити модель AlphaMissense, її потрібно провести в два етапи:

Перший етап

Навчання нейронної мережі так само, як і AF. Ця нейронна мережа натхненна такими великими моделями, як ChatGPT.

Прогнозуючи ідентичність амінокислот, замаскованих у випадкових позиціях у множинних вирівняннях послідовностей (MSA), це дає змогу прогнозувати одноланцюгову структуру, а також моделювати мову білка.

Дослідники внесли деякі незначні архітектурні модифікації в AF і збільшили вагові коефіцієнти втрат для моделювання білкової мови, досягнувши порівнянної продуктивності прогнозування структури з AF.

Після попереднього навчання головку моделювання замаскованої мови вже можна використовувати для прогнозування ефекту мутації шляхом обчислення логарифмічного співвідношення правдоподібності між еталонною амінокислотою та ймовірностями альтернативної амінокислоти, як у трансформаторі MSA та моделюванні еволюційного масштабування (EMS).

Ці нейронні мережі довели свою ефективність у передбаченні білкових структур і створенні нових білків, і особливо корисні для прогнозування варіантів, оскільки вони вже знають, які послідовності є достовірними, а які ні.

другий етап

На цьому етапі дослідники відкоригували модель людських білків, встановили послідовності мутацій для другої лінії MSA та додали варіантні цілі класифікації патогенності.

Потім дотримуйтесь методу PrimateAI, щоб позначити мутації в популяціях людей і приматів.

Звичайні мутації вважаються доброякісними, а мутації, яких раніше не було, вважаються патогенними.

Як тільки модель почала перевищувати набір для валідації (2526 варіантів Clin з рівною кількістю доброякісних і патогенних варіантів на ген), дослідники припинили навчання.

Однак AlphaMissense не передбачає змін у структурі білка після мутацій або інших впливів на стабільність білка.

Замість цього він використовує «інтуїцію» AlphaFold щодо структури, щоб ідентифікувати можливі хвороботворні мутації в білках.

Зокрема, відповідна база даних послідовності білка та інформація про структурний контекст мутації використовуються для створення безперервної оцінки між 0 і 1 для наближення патогенної ймовірності мутації.

Ця безперервна оцінка дозволяє користувачам вибрати поріг для класифікації мутацій як патогенних або доброякісних залежно від їхніх вимог до точності.

Як AlphaMissense класифікує міссенс-мутації людини

Під час експериментальної оцінки AlphaMissense досяг найсучасніших прогнозів у широкому діапазоні генетичних і експериментальних контрольних показників, не потребуючи спеціального навчання таким даним.

AlphaMissense перевершує інші обчислювальні методи при класифікації варіантів від Clin. Clin — це загальнодоступний архів даних про взаємозв’язок між людськими змінами та захворюваннями.

AlphaMissense також був найточнішим способом прогнозування лабораторних результатів, що свідчить про те, що він сумісний з різними способами вимірювання патогенності.

AlphaMissense перевершує інші обчислювальні методи у прогнозуванні ефектів варіантів міссенсу

ШІ змінює генетику

Рік тому Google DeepMind випустив 200 мільйонів білкових структур, передбачених за допомогою AlphaFold.

Ця ініціатива допомогла мільйонам учених у всьому світі прискорити дослідження та проклала шлях до нових відкриттів.

Тепер AlphaMissense, заснований на AlphaFold, ще більше поглибив світове розуміння білків, простеживши походження ДНК.

Знову ж таки, ключовим кроком у перекладі цього дослідження є співпраця з науковою спільнотою.

Google DeenpMind співпрацює з Genomics England, щоб дослідити, як прогнози AlphaMissense можуть допомогти у вивченні генетики рідкісних захворювань.

Genome England перехресно порівняв висновки AlphaMissense з попередньо зібраними даними про патогенність відомих мутацій людини.

Результати оцінювання узгоджуються з прогнозами AlphaMissense, які надають AlphaMissense реальний контрольний показник.

Google DeepMind опублікував таблицю пошуку міссенс-мутацій і поділився розширеними прогнозами всіх можливих 216 мільйонів замін послідовності однієї амінокислоти в більш ніж 19 000 людських білках.

Опубліковані дані також включають середнє прогнозоване значення для кожного гена, яке подібне до показника еволюційних обмежень гена, що вказує на те, наскільки цей ген важливий для виживання організму.

Приклади, передбачені AlphaMissense, накладені на структури, передбачені AlphaFold

(Червоний = передбачуваний патогенний, синій = передбачуваний доброякісний, сірий = невизначений)

Ліворуч: субодиниця бета-гемоглобіну (білок HBB). Варіації цього білка можуть викликати серповидно-клітинну анемію.

Праворуч: білок-регулятор трансмембранної провідності кістозного фіброзу (білок CFTR). Варіації цього білка можуть призвести до муковісцидозу.

Крім того, Google DeepMind також співпрацює з EMBL-EBI. За допомогою предиктора ефекту мутації Ensembl дослідникам буде легше застосовувати результати прогнозу AlphaMissense.

Вважається, що в найближчому майбутньому AlphaMissense допоможе вирішити ключові проблеми геноміки та всієї біологічної науки.

Література:

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити