Вдохновленный ChatGPT, Google DeepMind предсказывает 71 миллион генетических мутаций! ИИ расшифровывает генетический код генов человека в науке

Первоисточник: Синьчжиюань

Источник изображения: Создано Unbounded AI‌

После того, как модель прогнозирования белков AlphaFold вызвала волну уровня цунами в мире искусственного интеллекта, семейство Alpha положило начало новому выскочке.

Сегодня компания Google DeepMind выпустила новую модель искусственного интеллекта AlphaMissense, которая может предсказать 71 миллион «миссенс-мутаций».

В частности, из 89% «миссенс-мутаций», успешно предсказанных AlphaMissense, 57% были патогенными, а 32% — доброкачественными.

Бумажный адрес:

Только 0,1% мутаций могут быть подтверждены экспертами-людьми.

Чтобы исследователи могли лучше понять его возможное влияние, Google также обнародовал весь каталог десятков миллионов «миссенс-мутаций».

Выявление основной причины уже давно является одной из величайших задач в генетике человека.

Миссенс-мутации — это генетические мутации, которые могут повлиять на функцию «человеческих белков» и привести к таким заболеваниям, как муковисцидоз, серповидно-клеточная анемия и рак.

Рождение AlphaMissense демонстрирует огромный потенциал ИИ в области медицины, особенно в генетике.

Это имеет большое значение для понимания взаимосвязи между генетическими вариациями и заболеваниями и разработки целевых медикаментозных методов лечения.

Вслед за AlphaFold AlphaMissense может стать искусственным интеллектом, который сможет изменить мир и, как ожидается, преодолеет проблемы генетики человека!

**Что такое «миссенс-мутация»? **

Миссенс-мутация — это генетическая мутация, используемая в области биомедицины и молекулярной биологии для описания генов, кодирующих белки:

Замена одной буквы в ДНК приводит к образованию другой аминокислоты в белке.

Если вы думаете о ДНК как о языке, то замена одной буквы может изменить слово и полностью изменить смысл предложения.

В этом случае изменения ДНК приводят к изменениям аминокислот, которые влияют на функцию белка.

Среднестатистический человек является носителем более 9000 миссенс-мутаций.

Вообще говоря, большинство этих миссенс-мутаций доброкачественны и мало влияют на организм человека. Но оставшиеся немногие являются патогенными и могут серьезно нарушать функцию белка.

Миссенс-мутации можно использовать для диагностики редких генетических заболеваний, поскольку несколько или даже одна миссенс-мутация могут непосредственно вызвать заболевание.

Кроме того, они важны для изучения сложных заболеваний, таких как диабет II типа, который может быть вызван множеством различных типов генетических вариантов.

Таким образом, классификация миссенс-мутаций является важным шагом в понимании того, какие изменения белка могут способствовать заболеванию.

Из более чем 4 миллионов миссенс-мутаций, возникших у человека, только 2% были оценены экспертами как патогенные или доброкачественные.

Это составляет лишь около 0,1% от всех возможных 71 миллиона миссенс-мутаций.

Остальные мутации были классифицированы как «мутации неизвестного значения» из-за отсутствия экспериментальных или клинических данных о соответствующих эффектах.

Но с помощью AlphaMissense мы получили наиболее четкое представление о последствиях мутации:

AlphaMissense может классифицировать 89% мутаций с пороговой точностью 90% в базе данных мутаций известных заболеваний.

Создано на основе AlphaFold на основе большой модели ChatGPT

Итак, как же устроена AlphaMissense?

С момента своего выпуска AlphaFold и AlphaFold 2 предсказали структуру почти всех известных науке белков по их аминокислотным последовательностям, а это более 200 миллионов белков.

В связи с этим исследователи Google адаптировали модель на основе AlphaFold (далее — AF), чтобы они могли прогнозировать патогенность миссенс-мутаций, изменяющих одну аминокислоту в белке.

Проще говоря, весь принцип работы AlphaMissense заключается в следующем: взять аминокислотную последовательность в качестве входных данных и спрогнозировать патогенность всех возможных изменений отдельных аминокислот в заданном положении последовательности.

Для обучения модели AlphaMissense его необходимо провести в два этапа:

Первый этап

Обучите нейронную сеть так же, как AF. Эта нейронная сеть основана на крупных моделях, таких как ChatGPT.

Прогнозируя идентичность аминокислот, замаскированных в случайных положениях при множественном выравнивании последовательностей (MSA), он позволяет прогнозировать одноцепочечную структуру, а также моделировать белковый язык.

Исследователи внесли некоторые незначительные архитектурные изменения в AF и увеличили веса потерь для моделирования белкового языка, при этом добившись при этом производительности прогнозирования структуры, сопоставимой с AF.

После предварительного обучения головку моделирования языка масок уже можно использовать для прогнозирования эффекта мутации путем расчета логарифмического отношения правдоподобия между вероятностями эталонной аминокислоты и альтернативных аминокислот, как в MSA Transformer и Evolutionary Scaling Modeling (EMS).

Эти нейронные сети доказали свою эффективность в прогнозировании белковых структур и разработке новых белков и особенно полезны для прогнозирования вариантов, поскольку они уже знают, какие последовательности заслуживают доверия, а какие нет.

вторая стадия

На этом этапе исследователи доработали модель на человеческих белках, установили последовательности мутаций для второй линии MSA и добавили цели классификации вариантов патогенности.

Затем следуйте методу PrimateAI, чтобы пометить мутации в популяциях человека и приматов.

Распространенные мутации считаются доброкачественными, а ранее не встречавшиеся мутации считаются патогенными.

Как только модель начала подстраиваться под проверочный набор (2526 вариантов Clin с равным количеством доброкачественных и патогенных вариантов на ген), исследователи прекратили обучение.

Однако AlphaMissense не прогнозирует изменения в структуре белка после мутаций или других воздействий на стабильность белка.

Вместо этого он использует «интуицию» AlphaFold относительно структуры для выявления возможных мутаций в белках, вызывающих заболевания.

В частности, соответствующая база данных последовательностей белков и информация о структурном контексте мутации используются для создания непрерывной оценки от 0 до 1 для аппроксимации патогенной вероятности мутации.

Эта непрерывная оценка позволяет пользователям выбирать порог для классификации мутаций как патогенных или доброкачественных, в зависимости от их требований к точности.

Как AlphaMissense классифицирует миссенс-мутации человека

В ходе экспериментальной оценки AlphaMissense добилась самых современных прогнозов по широкому спектру генетических и экспериментальных критериев, и все это без необходимости явного обучения на таких данных.

AlphaMissense превосходит другие вычислительные методы при классификации вариантов Clin. Clin — это общедоступный архив данных о взаимосвязи между человеческими вариациями и болезнями.

AlphaMissense также оказалась наиболее точным способом прогнозирования результатов лабораторных исследований, что позволяет предположить, что она согласуется с различными способами измерения патогенности.

AlphaMissense превосходит другие вычислительные методы в прогнозировании эффектов миссенс-вариантов.

ИИ меняет генетику

Год назад Google DeepMind опубликовал 200 миллионов белковых структур, предсказанных с помощью AlphaFold.

Эта инициатива помогла миллионам учёных по всему миру ускорить исследования и проложила путь к новым открытиям.

Теперь AlphaMissense, основанная на AlphaFold, еще больше углубила понимание белков в мире, отслеживая происхождение ДНК.

Опять же, ключевым шагом в переводе этого исследования является сотрудничество с научным сообществом.

Google DeenpMind сотрудничает с Genomics England, чтобы изучить, как прогнозы AlphaMissense могут помочь в изучении генетики редких заболеваний.

Компания Genome England сопоставила результаты AlphaMissense с ранее собранными данными о патогенности известных человеческих мутаций.

Результаты оценки согласуются с прогнозами AlphaMissense, что дает AlphaMissense реальный эталон.

Google DeepMind опубликовал таблицу поиска миссенс-мутаций и поделился расширенными прогнозами всех возможных 216 миллионов замен одноаминокислотных последовательностей в более чем 19 000 человеческих белках.

Опубликованные данные также включают среднее прогнозируемое значение для каждого гена, которое аналогично показателю эволюционных ограничений гена и указывает на то, насколько важен этот ген для выживания организма.

Примеры, предсказанные AlphaMissense, наложены на структуры, предсказанные AlphaFold.

(Красный = предположительно патогенный, синий = предположительно доброкачественный, серый = не уверен)

Слева: субъединица бета-гемоглобина (белок HBB). Вариации этого белка могут вызвать серповидноклеточную анемию.

Справа: белок-регулятор трансмембранной проводимости муковисцидоза (белок CFTR). Вариации этого белка могут привести к муковисцидозу.

Более того, Google DeepMind также сотрудничает с EMBL-EBI. Благодаря предсказателю эффекта мутации Ensembl исследователям будет легче применять результаты прогнозирования AlphaMissense.

Считается, что в ближайшем будущем AlphaMissense поможет решить ключевые проблемы геномики и всей биологической науки.

Использованная литература:

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить