Международная группа ученых обнаружила ранее неизвестные РНК-вирусы, включая девять новых коронавирусов. Об этом сообщается в статье, опубликованной в журнале Nature.
В рамках проекта Serratus исследователи проанализировали последовательности генов в 5,7 миллиона биологических образцах (от ледяных кернов до навоза), собранных по всему миру за 13 лет, с помощью суперкомпьютера AWS, который эквивалентен по мощности 22,5 тысячи процессорам. Целью был поиск гена, кодирующего РНК-зависимую РНК-полимеразу (RdRP), которая указывает на присутствие РНК-вирусов.
Ученые обнаружили около 132 тысяч РНК-вирусов (ранее было известно только о 15 тысячах), включая девять новых видов коронавирусов. Все коронавирусы были найдены в образцах, связанных с водными позвоночными, в том числе аксолотлем, морским коньком, рыбой-фугу и другими.
Существующие базы генетических последовательностей превышают объем в 20 петабаз, то есть 20 на 10 в 15-й степени букв ДНК, и растут в геометрической последовательности. Суперкомпьютер AWS, работающий на основе облачных вычислений, оказался способен выравнивать последовательности (то есть сравнивать гомологичные участки двух и более цепочек ДНК) со сверхвысокой пропускной способностью.
По словам авторов работы, изучение вирома Земли (совокупности вирусных геномов в масштабе планеты) важно для подготовки к следующей пандемии. Проанализированные данные охватывает лишь 0,1 процента всех видов вирусов, чье число оценивается от сотни миллионов до триллиона. Исследователи предоставили бесплатный доступ к 883 502 последовательностям, которые кодируют RdRP, включая полимеразу 131 957 РНК-вирусов, чтобы улучшить диагностику потенциально опасных вирусных инфекций.