Prediksi Struktur Seluruh Proteome Varian Monkeypox
Virus cacar monyet adalah virus orthopoxvirus zoonosis langka yang menyebabkan penyakit dengan gejala yang mirip dengan cacar. Ini dapat ditularkan melalui kontak tubuh, permukaan mukosa internal, atau benda yang terkontaminasi. Dengan pemberantasan cacar pada tahun 1980 dan penghentian berikutnya vaksinasi terhadap cacar, monkeypox menjadi salah satu poxvirus yang paling parah. Setelah masa inkubasi 5-21 hari, infeksi cacar monyet menyebabkan demam, pembengkakan kelenjar getah bening, dan ruam karakteristik yang luas. Angka kematian yang didokumentasikan adalah antara 0% dan 11%, dan telah dilaporkan lebih tinggi di antara anak-anak. Selain mencegah cacar monyet dengan menghindari penularan primer dari hewan ke manusia, vaksinasi mungkin efektif melawan infeksi cacar monyet. Namun, beberapa populasi di mana vaksinasi cacar rutin telah dihentikan lebih rentan terhadap cacar monyet, karena vaksinasi tersebut memberikan perlindungan silang efektif >80% terhadap cacar monyet. Berbagai senyawa untuk melawan virus monkeypox juga sedang dikembangkan.
Dua clades yang berbeda telah diidentifikasi: clade Afrika
Barat dan clade Congo Basin, juga dikenal sebagai clade Afrika Tengah.
Baru-baru ini, urutan genom dari varian virus monkeypox yang terkait dengan
wabah saat ini yang mempengaruhi banyak negara telah dilaporkan. Analisis
filogenetik cepat telah menunjukkan bahwa varian 2022 milik clade Afrika Barat
dan paling erat terkait dengan varian dari Nigeria pada tahun 2018. Dengan
peningkatan kasus monkeypox di seluruh dunia, pemahaman yang lebih baik tentang
varian baru penting untuk mempercepat pengembangan anti -vaksin dan obat-obatan
cacar monyet.
Pertama, kami mengumpulkan urutan genetik dari varian virus
monkeypox yang dicirikan dengan baik—strain virus Kongo 1996 (Zaire-96-I-16,
ID: NC_003310.1), strain Afrika Barat 2018 (MPXV-UK_P3, ID: MT903345. 1), dan
2022 strain Afrika Barat MPXV_USA_2022_MA001, ID: ON563414.3)—dari bank data
NCBI untuk menghasilkan seluruh kumpulan data proteome. Kami mengikuti kerangka
baca terbuka bank data NCBI untuk mengekstrak 191, 190, dan 190 protein dari
galur 1996, 2018, dan 2022, masing-masing. Strain Afrika Barat 2018 menunjukkan
proteome yang sangat mirip dengan strain 2022, dengan korespondensi di antara
semua 190 protein. Namun, tujuh protein pada galur 1996 tidak ada pada galur
2018 dan 2022 (Gambar 1A). Sebagai contoh, sebuah gen bernama BR-209 pada
strain virus Kongo 1996 mengkodekan protein full-length 326 asam amino (A.A.),
yang terdiri dari fragmen N-terminal dari 210 A.A. dan fragmen C-terminal 126
A.A. Namun, galur Afrika Barat mengandung penyisipan satu basa di dekat
terminal N dan penghapusan empat basa, sehingga menyebabkan dua pergeseran
bingkai yang menghasilkan protein baru yang terdiri dari terminal N 163 A.A.
fragmen dan C-terminal 132 A.A. pecahan. Karena BR-209 dapat berfungsi sebagai
protein pengikat interleukin-1β (IL-1β) yang mencegah IL-1β berinteraksi dengan
reseptor IL-1, perbedaan antara BR-209 dari strain monkeypox Kongo versus
Afrika Barat dapat mempengaruhi virulensi. Kami kemudian menggunakan AF2-Batch,
kerangka kerja AlphaFold2 mode batch, untuk memprediksi model struktural 3D
dari semua protein yang dianalisis (Gambar 1B). Singkatnya, kami
mengimplementasikan kembali protokol prediksi struktur AlphaFold2 dengan
terlebih dahulu mendekomposisi alur kerja komputasi menjadi penyelarasan
beberapa urutan, inferensi ujung ke ujung, dan penyempurnaan struktur, kemudian
memparalelkan perhitungan dengan pengkodean MPI pada infrastruktur
superkomputasi berbasis Slurm. Sementara itu, kami menulis ulang modul
struktural ujung-ke-ujung bersama dengan backend TensorFlow untuk menghindari
beberapa kompilasi pustaka JAX. Pipeline ini memungkinkan lebih dari 10.000
prediksi struktur dibuat per hari pada workstation GPU A100 dengan sepuluh node
CPU 50-core, dengan kecepatan kira-kira sepuluh kali lipat dari pipeline
AlphaFold2 asli. AF2-Batch meningkatkan kemampuan untuk dengan cepat
memprediksi banyak struktur protein, termasuk studi fungsional genom-ke-proteom
dan prediksi struktur protein yang bermutasi secara sistematis. Karena
munculnya kasus monkeypox baru-baru ini, kami segera merilis model struktur di
situs web https://www.zelixir.com/Monkeypox/index.html, yang memungkinkan
penggunaan gratis untuk memfasilitasi studi lebih lanjut.
Gambar 1. Perbedaan utama antara strain virus Kongo 1996
(Zaire-96-I-16, ID: NC_003310.1), strain Afrika Barat 2018 (MPXV-UK_P3, ID:
MT903345.1), dan strain Afrika Barat 2022 MPXV_USA_2022_MA001, ID: ON563414. 3)
proteom. B) distribusi skor plDDT dari model struktur peringkat teratas dari
proteom virus monkeypox. Skor yang lebih tinggi menunjukkan kepercayaan yang
lebih tinggi dari model. C) Distribusi skor PointSite dari model struktur
peringkat teratas dari proteom virus monkeypox. Skor yang lebih tinggi menunjukkan
kemungkinan yang lebih besar dari keberadaan setidaknya satu kantong pengikat
molekul kecil. Panel menunjukkan bahwa setidaknya sepertiga dari protein
mungkin memiliki kantong pengikat molekul kecil di tiga galur. D) Prediksi
PointSite dari kantong pengikat P37. Warna yang berbeda menunjukkan keyakinan
prediksi. Semakin dekat nilainya dengan 1, semakin besar kemungkinan atom
tersebut termasuk dalam daerah pengikatan. E) Struktur kimia tecovirimat. F)
Tecovirimat pas dengan kantong P37. Tecovirimat ditampilkan sebagai bola hijau.
G) Struktur detail saku P37 dengan tecovirimat terikat. H) Jumlah struktur
serupa (skor TM > 0,6) dan distribusi model prediksi proteom virus monkeypox
peringkat teratas. I) Prediksi struktur full-length A35R oleh AF2-batch. Warna
pelangi menunjukkan rantai utama dari ujung N ke ujung C. J) Penjajaran
struktur A35R dari virus monkeypox (warna laut) galur 2022 dan A33R dari virus
vaccinia (warna gandum). K) Pengenalan A33R dari virus vaccinia dan antibodi
A2C7. Rantai berat A2C7 berwarna biru muda, dan rantai ringan A2C7 berwarna
hijau pucat.
Setelah menyelesaikan prediksi struktur protein, kami menerapkan
model PointSite dalam untuk membubuhi keterangan daerah pengikatan potensial
untuk molekul kecil pada permukaan protein (Gambar 1C). Berdasarkan model
struktur peringkat atas, model menunjukkan kemungkinan setiap atom protein
untuk menyusun daerah pengikat molekul kecil. Hasilnya juga telah dirilis untuk
penggunaan umum di situs web. Di sini, kami memilih salah satu protein cacar
yang dicirikan dengan baik, P37, untuk menyajikan hasil PointSite. Protein
homolog P37, yang memainkan peran sentral dalam membentuk partikel virus yang
terbungkus dalam virus cacar, adalah target yang divalidasi untuk pengobatan
anti-cacar (Gambar 1D). Semakin dekat nilainya dengan 1, semakin besar
kemungkinan atom menjadi bagian dari daerah pengikatan. Tecovirimat, obat
anti-cacar pertama yang disetujui FDA, disetujui pada 2018 (Gambar 1E). Namun,
mekanisme pengenalan rinci tecovirimat pada P37 tidak jelas. Kami menggunakan
PointSite untuk memprediksi potensi situs pengikatan monkeypox P37. Kemudian
kami memasang tecovirimat di saku yang diduga (Gambar 1F). Tecovirimat cocok
dengan kantong, dan energi ikat yang diprediksi oleh AutoDock Vina adalah
sekitar -8.0 kkal/mol (Gambar 1G). Algoritme ini dapat membantu dalam pemilihan
protein yang cepat dengan kemungkinan situs pengikatan molekul kecil untuk
pengembangan obat lebih lanjut yang menargetkan protein poxviral lainnya.
Untuk mempelajari lebih baik karakteristik protein cacar
monyet yang dilestarikan, kami membuat keberpihakan struktural terhadap subset
database Protein Data Bank (PDB70) untuk setiap protein cacar monyet, sehingga
memperoleh daftar protein dengan struktur serupa (Gambar 1H). Alat
algoritma-penyelarasan protein berbasis struktur DeepAlign diterapkan untuk
menentukan peringkat kesamaan menurut DeepScore. Fungsi ini dapat membantu
dalam anotasi fungsi protein yang tidak diketahui berdasarkan kesamaan
struktural. Di sini, kami menggunakan protein A35R untuk menyajikan hasilnya
(Gambar 1I). Daftar keselarasan struktural A35R, khususnya domain globular,
memiliki kesamaan yang tinggi dengan A33R dari virus vaccinia (PDB ID: 4LQF) (Gambar
1J). Struktur ini menunjukkan kompleks protein A33R dengan antibodi A2C7
(Gambar 1K). A33R adalah glikoprotein membran tipe II khusus virus yang
diselimuti ekstraseluler (EEV) yang terkenal. Karena memainkan peran penting
dalam pembentukan EEV yang efisien dan memfasilitasi penyebaran virus jarak
jauh pada inang, A33 adalah target potensial untuk pengembangan antibodi
penetral yang menargetkan EEV. Demikian pula, A35R dari virus monkeypox juga
merupakan target pengembangan antibodi terapeutik untuk menghambat penyebaran
virus.
Singkatnya, kami memperkirakan lebih dari 600 struktur dan
menambahkan anotasi fungsional protein dari proteom virus monkeypox untuk
penggunaan umum. Kami menyediakan anotasi ekstensif dengan menggunakan
algoritme PointSite, dan memberi label wilayah pengikat molekul kecil dengan
keyakinan tinggi untuk semua 600+ struktur yang diprediksi. Sementara itu,
struktur yang ditentukan secara eksperimental dengan kemiripan tinggi dengan
protein cacar monyet diperiksa melalui algoritma penyelarasan struktur. Kami
berharap pekerjaan kami akan mempercepat pengembangan vaksin cacar monyet,
antibodi penetralisir, dan obat terapeutik.
No comments