Terinspirasi oleh ChatGPT, Google DeepMind memperkirakan 71 juta mutasi genetik! AI menguraikan kode genetik gen manusia dalam Sains

Sumber asli: Xinzhiyuan

Sumber gambar: Dihasilkan oleh AI Tanpa Batas‌

Setelah model prediksi protein AlphaFold memicu gelombang tingkat tsunami di dunia AI, keluarga Alpha memperkenalkan sebuah startup baru.

Hari ini, Google DeepMind merilis model AI baru-AlphaMissense, yang dapat memprediksi 71 juta "mutasi missense".

Secara khusus, dari 89% "mutasi missense" yang berhasil diprediksi oleh AlphaMissense, 57% bersifat patogen dan 32% bersifat jinak.

Alamat kertas:

Hanya 0,1% mutasi yang dapat dikonfirmasi oleh ahli manusia.

Agar para peneliti dapat lebih memahami dampak yang mungkin terjadi, Google juga telah mempublikasikan seluruh katalog puluhan juta "mutasi missense".

Menemukan penyebab utama telah lama menjadi salah satu tantangan terbesar dalam genetika manusia.

Mutasi missense adalah mutasi genetik yang dapat mempengaruhi fungsi "protein manusia" dan dapat menyebabkan penyakit seperti fibrosis kistik, anemia sel sabit, dan kanker.

Kelahiran AlphaMissense menunjukkan besarnya potensi AI di bidang medis, khususnya genetika.

Hal ini sangat penting untuk memahami hubungan antara variasi genetik dan penyakit serta mengembangkan pengobatan obat yang ditargetkan.

Mengikuti AlphaFold, AlphaMissense mungkin akan menjadi AI yang dapat mengubah dunia dan diharapkan dapat mengatasi permasalahan genetika manusia!

**Apa yang dimaksud dengan "mutasi missense"? **

Mutasi missense adalah mutasi genetik yang digunakan dalam bidang biomedis dan biologi molekuler untuk menggambarkan gen pengkode protein:

Substitusi satu huruf pada DNA menghasilkan asam amino berbeda dalam suatu protein.

Jika Anda menganggap DNA sebagai sebuah bahasa, maka penggantian satu huruf dapat mengubah sebuah kata dan mengubah arti sebuah kalimat sepenuhnya.

Dalam hal ini, perubahan pada DNA menyebabkan perubahan asam amino yang mempengaruhi fungsi protein.

Rata-rata orang membawa lebih dari 9.000 mutasi missense.

Secara umum, sebagian besar mutasi missense ini bersifat jinak dan berdampak kecil pada tubuh manusia. Namun beberapa sisanya bersifat patogen dan dapat sangat mengganggu fungsi protein.

Mutasi missense dapat digunakan untuk diagnosis penyakit genetik langka, karena beberapa atau bahkan satu mutasi missense dapat menyebabkan penyakit secara langsung.

Selain itu, penelitian ini penting untuk mempelajari penyakit kompleks, seperti diabetes tipe II, yang mungkin disebabkan oleh berbagai jenis varian genetik.

Oleh karena itu, mengklasifikasikan mutasi missense merupakan langkah penting dalam memahami perubahan protein mana yang dapat menyebabkan penyakit.

Dari lebih dari 4 juta mutasi missense yang muncul pada manusia, hanya 2% yang diberi label oleh para ahli sebagai patogen atau jinak.

Ini hanya mewakili sekitar 0,1% dari seluruh kemungkinan 71 juta mutasi missense.

Mutasi yang tersisa diklasifikasikan sebagai "mutasi yang signifikansinya tidak diketahui" karena kurangnya data eksperimental atau klinis mengenai efek yang relevan.

Namun dengan AlphaMissense, kami mendapatkan gambaran paling jelas tentang efek mutasi:

AlphaMissense dapat mengklasifikasikan 89% mutasi dengan ambang batas akurasi 90% dalam database mutasi penyakit yang diketahui.

Dibangun berdasarkan AlphaFold, terinspirasi oleh model besar ChatGPT

Jadi, bagaimana sebenarnya AlphaMissense dibuat?

Sejak dirilis, AlphaFold dan AlphaFold 2 telah memperkirakan struktur hampir semua protein yang diketahui sains dari rangkaian asam aminonya, lebih dari 200 juta+ protein.

Dalam hal ini, peneliti Google mengadaptasi model berdasarkan AlphaFold (selanjutnya disebut AF), sehingga mereka dapat memprediksi patogenisitas mutasi missense yang mengubah satu asam amino dalam suatu protein.

Sederhananya, seluruh prinsip kerja AlphaMissense adalah: mengambil rangkaian asam amino sebagai masukan dan memprediksi patogenisitas semua kemungkinan perubahan asam amino tunggal pada posisi tertentu dalam rangkaian tersebut.

Untuk melatih model AlphaMissense perlu dilakukan dalam dua tahap:

Tahap pertama

Latih jaringan saraf sama seperti AF. Jaringan saraf ini terinspirasi oleh model besar seperti ChatGPT.

Dengan memprediksi identitas asam amino yang ditutupi pada posisi acak dalam penyelarasan beberapa urutan (MSA), hal ini memungkinkan prediksi struktur rantai tunggal, serta pemodelan bahasa protein.

Para peneliti membuat beberapa modifikasi arsitektur kecil pada AF dan meningkatkan bobot kerugian untuk pemodelan bahasa protein, sambil tetap mencapai kinerja prediksi struktur yang sebanding dengan AF.

Setelah pra-pelatihan, kepala pemodelan bahasa bertopeng sudah dapat digunakan untuk prediksi efek mutasi dengan menghitung rasio log-likelihood antara asam amino referensi dan probabilitas asam amino alternatif, seperti yang dilakukan MSA Transformer dan Evolutionary Scaling Modeling (EMS).

Jaringan saraf ini telah terbukti bagus dalam memprediksi struktur protein dan merancang protein baru, dan sangat berguna untuk memprediksi varian karena jaringan tersebut sudah mengetahui urutan mana yang kredibel dan mana yang tidak.

tahap kedua

Pada tahap ini, para peneliti menyempurnakan model protein manusia, menetapkan urutan mutasi untuk MSA lini kedua, dan menambahkan target klasifikasi patogenisitas varian.

Kemudian, ikuti metode PrimateAI untuk memberi label mutasi pada populasi manusia dan primata.

Mutasi yang umum dianggap jinak, dan mutasi yang belum pernah terlihat sebelumnya dianggap patogen.

Setelah model mulai mengalami overfit pada set validasi (2.526 varian Clin, dengan jumlah varian jinak dan patogen yang sama per gen), para peneliti menghentikan pelatihan.

Namun, AlphaMissense tidak memprediksi perubahan struktur protein setelah mutasi atau efek lain terhadap stabilitas protein.

Sebaliknya, ia menggunakan "intuisi" AlphaFold tentang struktur untuk mengidentifikasi kemungkinan mutasi penyebab penyakit pada protein.

Secara khusus, database urutan protein yang relevan dan informasi konteks struktural dari mutasi digunakan untuk menghasilkan skor berkelanjutan antara 0 dan 1 untuk memperkirakan kemungkinan patogenik dari mutasi.

Skor berkelanjutan ini memungkinkan pengguna memilih ambang batas untuk mengklasifikasikan mutasi sebagai patogen atau jinak, bergantung pada persyaratan akurasinya.

Bagaimana AlphaMissense mengklasifikasikan mutasi missense manusia

Dalam evaluasi eksperimental, AlphaMissense mencapai prediksi canggih di berbagai tolok ukur genetik dan eksperimental, semuanya tanpa memerlukan pelatihan eksplisit mengenai data tersebut.

AlphaMissense mengungguli metode komputasi lainnya saat mengklasifikasikan varian dari Clin. Clin adalah arsip data publik tentang hubungan antara variasi manusia dan penyakit.

AlphaMissense juga merupakan cara paling akurat untuk memprediksi hasil laboratorium, menunjukkan bahwa metode ini konsisten dengan berbagai cara untuk mengukur patogenisitas.

AlphaMissense mengungguli metode komputasi lainnya dalam memprediksi efek varian missense

AI mengubah genetika

Setahun yang lalu, Google DeepMind merilis 200 juta struktur protein yang diprediksi menggunakan AlphaFold.

Inisiatif ini telah membantu jutaan ilmuwan di seluruh dunia mempercepat penelitian dan membuka jalan bagi penemuan-penemuan baru.

Kini, AlphaMissense, berdasarkan AlphaFold, semakin memperdalam pemahaman dunia tentang protein dengan menelusuri asal usul DNA.

Sekali lagi, langkah kunci dalam menerjemahkan penelitian ini adalah kolaborasi dengan komunitas ilmiah.

Google DeenpMind telah bekerja sama dengan Genomics England untuk mengeksplorasi bagaimana prediksi AlphaMissense dapat membantu mempelajari genetika penyakit langka.

Genome England melakukan referensi silang terhadap temuan AlphaMissense dengan data yang dikumpulkan sebelumnya mengenai patogenisitas mutasi manusia yang diketahui.

Hasil evaluasi konsisten dengan prediksi AlphaMissense, yang memberikan AlphaMissense tolok ukur dunia nyata.

Google DeepMind telah menerbitkan tabel pencarian mutasi missense dan membagikan prediksi yang diperluas tentang kemungkinan 216 juta substitusi rangkaian asam amino tunggal di lebih dari 19.000 protein manusia.

Data yang dipublikasikan juga mencakup nilai prediksi rata-rata untuk setiap gen, yang serupa dengan ukuran batasan evolusi suatu gen, yang menunjukkan betapa pentingnya gen tersebut bagi kelangsungan hidup suatu organisme.

Contoh yang diprediksi oleh AlphaMissense ditumpangkan pada struktur yang diprediksi oleh AlphaFold

(Merah = diprediksi bersifat patogen, biru = diprediksi jinak, abu-abu = tidak pasti)

Kiri: Subunit beta-hemoglobin (protein HBB). Variasi protein ini dapat menyebabkan anemia sel sabit.

Kanan: Protein pengatur konduktansi transmembran fibrosis kistik (protein CFTR). Variasi protein ini dapat menyebabkan fibrosis kistik.

Selain itu, Google DeepMind juga telah menjalin kerja sama dengan EMBL-EBI. Melalui prediktor efek mutasi Ensembl, peneliti akan lebih mudah menerapkan hasil prediksi AlphaMissense.

Dipercaya bahwa dalam waktu dekat, AlphaMissense akan membantu memecahkan masalah inti dalam genomik dan seluruh ilmu biologi.

Referensi:

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)