Breaking News

Prediksi Struktur Seluruh Proteome Varian Monkeypox

Virus cacar monyet adalah virus orthopoxvirus zoonosis langka yang menyebabkan penyakit dengan gejala yang mirip dengan cacar. Ini dapat ditularkan melalui kontak tubuh, permukaan mukosa internal, atau benda yang terkontaminasi. Dengan pemberantasan cacar pada tahun 1980 dan penghentian berikutnya vaksinasi terhadap cacar, monkeypox menjadi salah satu poxvirus yang paling parah. Setelah masa inkubasi 5-21 hari, infeksi cacar monyet menyebabkan demam, pembengkakan kelenjar getah bening, dan ruam karakteristik yang luas. Angka kematian yang didokumentasikan adalah antara 0% dan 11%, dan telah dilaporkan lebih tinggi di antara anak-anak. Selain mencegah cacar monyet dengan menghindari penularan primer dari hewan ke manusia, vaksinasi mungkin efektif melawan infeksi cacar monyet. Namun, beberapa populasi di mana vaksinasi cacar rutin telah dihentikan lebih rentan terhadap cacar monyet, karena vaksinasi tersebut memberikan perlindungan silang efektif >80% terhadap cacar monyet. Berbagai senyawa untuk melawan virus monkeypox juga sedang dikembangkan.

Dua clades yang berbeda telah diidentifikasi: clade Afrika Barat dan clade Congo Basin, juga dikenal sebagai clade Afrika Tengah. Baru-baru ini, urutan genom dari varian virus monkeypox yang terkait dengan wabah saat ini yang mempengaruhi banyak negara telah dilaporkan. Analisis filogenetik cepat telah menunjukkan bahwa varian 2022 milik clade Afrika Barat dan paling erat terkait dengan varian dari Nigeria pada tahun 2018. Dengan peningkatan kasus monkeypox di seluruh dunia, pemahaman yang lebih baik tentang varian baru penting untuk mempercepat pengembangan anti -vaksin dan obat-obatan cacar monyet.

Pertama, kami mengumpulkan urutan genetik dari varian virus monkeypox yang dicirikan dengan baik—strain virus Kongo 1996 (Zaire-96-I-16, ID: NC_003310.1), strain Afrika Barat 2018 (MPXV-UK_P3, ID: MT903345. 1), dan 2022 strain Afrika Barat MPXV_USA_2022_MA001, ID: ON563414.3)—dari bank data NCBI untuk menghasilkan seluruh kumpulan data proteome. Kami mengikuti kerangka baca terbuka bank data NCBI untuk mengekstrak 191, 190, dan 190 protein dari galur 1996, 2018, dan 2022, masing-masing. Strain Afrika Barat 2018 menunjukkan proteome yang sangat mirip dengan strain 2022, dengan korespondensi di antara semua 190 protein. Namun, tujuh protein pada galur 1996 tidak ada pada galur 2018 dan 2022 (Gambar 1A). Sebagai contoh, sebuah gen bernama BR-209 pada strain virus Kongo 1996 mengkodekan protein full-length 326 asam amino (A.A.), yang terdiri dari fragmen N-terminal dari 210 A.A. dan fragmen C-terminal 126 A.A. Namun, galur Afrika Barat mengandung penyisipan satu basa di dekat terminal N dan penghapusan empat basa, sehingga menyebabkan dua pergeseran bingkai yang menghasilkan protein baru yang terdiri dari terminal N 163 A.A. fragmen dan C-terminal 132 A.A. pecahan. Karena BR-209 dapat berfungsi sebagai protein pengikat interleukin-1β (IL-1β) yang mencegah IL-1β berinteraksi dengan reseptor IL-1, perbedaan antara BR-209 dari strain monkeypox Kongo versus Afrika Barat dapat mempengaruhi virulensi. Kami kemudian menggunakan AF2-Batch, kerangka kerja AlphaFold2 mode batch, untuk memprediksi model struktural 3D dari semua protein yang dianalisis (Gambar 1B). Singkatnya, kami mengimplementasikan kembali protokol prediksi struktur AlphaFold2 dengan terlebih dahulu mendekomposisi alur kerja komputasi menjadi penyelarasan beberapa urutan, inferensi ujung ke ujung, dan penyempurnaan struktur, kemudian memparalelkan perhitungan dengan pengkodean MPI pada infrastruktur superkomputasi berbasis Slurm. Sementara itu, kami menulis ulang modul struktural ujung-ke-ujung bersama dengan backend TensorFlow untuk menghindari beberapa kompilasi pustaka JAX. Pipeline ini memungkinkan lebih dari 10.000 prediksi struktur dibuat per hari pada workstation GPU A100 dengan sepuluh node CPU 50-core, dengan kecepatan kira-kira sepuluh kali lipat dari pipeline AlphaFold2 asli. AF2-Batch meningkatkan kemampuan untuk dengan cepat memprediksi banyak struktur protein, termasuk studi fungsional genom-ke-proteom dan prediksi struktur protein yang bermutasi secara sistematis. Karena munculnya kasus monkeypox baru-baru ini, kami segera merilis model struktur di situs web https://www.zelixir.com/Monkeypox/index.html, yang memungkinkan penggunaan gratis untuk memfasilitasi studi lebih lanjut.

Gambar 1. Perbedaan utama antara strain virus Kongo 1996 (Zaire-96-I-16, ID: NC_003310.1), strain Afrika Barat 2018 (MPXV-UK_P3, ID: MT903345.1), dan strain Afrika Barat 2022 MPXV_USA_2022_MA001, ID: ON563414. 3) proteom. B) distribusi skor plDDT dari model struktur peringkat teratas dari proteom virus monkeypox. Skor yang lebih tinggi menunjukkan kepercayaan yang lebih tinggi dari model. C) Distribusi skor PointSite dari model struktur peringkat teratas dari proteom virus monkeypox. Skor yang lebih tinggi menunjukkan kemungkinan yang lebih besar dari keberadaan setidaknya satu kantong pengikat molekul kecil. Panel menunjukkan bahwa setidaknya sepertiga dari protein mungkin memiliki kantong pengikat molekul kecil di tiga galur. D) Prediksi PointSite dari kantong pengikat P37. Warna yang berbeda menunjukkan keyakinan prediksi. Semakin dekat nilainya dengan 1, semakin besar kemungkinan atom tersebut termasuk dalam daerah pengikatan. E) Struktur kimia tecovirimat. F) Tecovirimat pas dengan kantong P37. Tecovirimat ditampilkan sebagai bola hijau. G) Struktur detail saku P37 dengan tecovirimat terikat. H) Jumlah struktur serupa (skor TM > 0,6) dan distribusi model prediksi proteom virus monkeypox peringkat teratas. I) Prediksi struktur full-length A35R oleh AF2-batch. Warna pelangi menunjukkan rantai utama dari ujung N ke ujung C. J) Penjajaran struktur A35R dari virus monkeypox (warna laut) galur 2022 dan A33R dari virus vaccinia (warna gandum). K) Pengenalan A33R dari virus vaccinia dan antibodi A2C7. Rantai berat A2C7 berwarna biru muda, dan rantai ringan A2C7 berwarna hijau pucat.

Setelah menyelesaikan prediksi struktur protein, kami menerapkan model PointSite dalam untuk membubuhi keterangan daerah pengikatan potensial untuk molekul kecil pada permukaan protein (Gambar 1C). Berdasarkan model struktur peringkat atas, model menunjukkan kemungkinan setiap atom protein untuk menyusun daerah pengikat molekul kecil. Hasilnya juga telah dirilis untuk penggunaan umum di situs web. Di sini, kami memilih salah satu protein cacar yang dicirikan dengan baik, P37, untuk menyajikan hasil PointSite. Protein homolog P37, yang memainkan peran sentral dalam membentuk partikel virus yang terbungkus dalam virus cacar, adalah target yang divalidasi untuk pengobatan anti-cacar (Gambar 1D). Semakin dekat nilainya dengan 1, semakin besar kemungkinan atom menjadi bagian dari daerah pengikatan. Tecovirimat, obat anti-cacar pertama yang disetujui FDA, disetujui pada 2018 (Gambar 1E). Namun, mekanisme pengenalan rinci tecovirimat pada P37 tidak jelas. Kami menggunakan PointSite untuk memprediksi potensi situs pengikatan monkeypox P37. Kemudian kami memasang tecovirimat di saku yang diduga (Gambar 1F). Tecovirimat cocok dengan kantong, dan energi ikat yang diprediksi oleh AutoDock Vina adalah sekitar -8.0 kkal/mol (Gambar 1G). Algoritme ini dapat membantu dalam pemilihan protein yang cepat dengan kemungkinan situs pengikatan molekul kecil untuk pengembangan obat lebih lanjut yang menargetkan protein poxviral lainnya.

Untuk mempelajari lebih baik karakteristik protein cacar monyet yang dilestarikan, kami membuat keberpihakan struktural terhadap subset database Protein Data Bank (PDB70) untuk setiap protein cacar monyet, sehingga memperoleh daftar protein dengan struktur serupa (Gambar 1H). Alat algoritma-penyelarasan protein berbasis struktur DeepAlign diterapkan untuk menentukan peringkat kesamaan menurut DeepScore. Fungsi ini dapat membantu dalam anotasi fungsi protein yang tidak diketahui berdasarkan kesamaan struktural. Di sini, kami menggunakan protein A35R untuk menyajikan hasilnya (Gambar 1I). Daftar keselarasan struktural A35R, khususnya domain globular, memiliki kesamaan yang tinggi dengan A33R dari virus vaccinia (PDB ID: 4LQF) (Gambar 1J). Struktur ini menunjukkan kompleks protein A33R dengan antibodi A2C7 (Gambar 1K). A33R adalah glikoprotein membran tipe II khusus virus yang diselimuti ekstraseluler (EEV) yang terkenal. Karena memainkan peran penting dalam pembentukan EEV yang efisien dan memfasilitasi penyebaran virus jarak jauh pada inang, A33 adalah target potensial untuk pengembangan antibodi penetral yang menargetkan EEV. Demikian pula, A35R dari virus monkeypox juga merupakan target pengembangan antibodi terapeutik untuk menghambat penyebaran virus.

Singkatnya, kami memperkirakan lebih dari 600 struktur dan menambahkan anotasi fungsional protein dari proteom virus monkeypox untuk penggunaan umum. Kami menyediakan anotasi ekstensif dengan menggunakan algoritme PointSite, dan memberi label wilayah pengikat molekul kecil dengan keyakinan tinggi untuk semua 600+ struktur yang diprediksi. Sementara itu, struktur yang ditentukan secara eksperimental dengan kemiripan tinggi dengan protein cacar monyet diperiksa melalui algoritma penyelarasan struktur. Kami berharap pekerjaan kami akan mempercepat pengembangan vaksin cacar monyet, antibodi penetralisir, dan obat terapeutik.

No comments