スーパーコンピューターによって発見された13万種の新しいRNAウイルス。9種のコロナウイルスも含まれていた
 クラウドで実現された、途方もなく強力な演算能力を持つスーパーコンピューターによる解析で、新たな13万種以上の「RNAウイルス」が確認された。その中には新種のコロナウイルスも9種含まれていたそうだ。


 こうした研究は、今後何らかの未知のウイルスが発見された場合、素早く対策を講じ、新型コロナのような大流行を未然に防ぐことを可能にするという。

新たな13万2000種のRNAウイルスが明らかに 『Nature』(2022年1月26日付)で報告された研究結果は、一般に公開されているRNA配列データをクラウドコンピューティングで再解析することで得られたものだ。

 その演算能力は、CPU2万2500個分に相当するもので、途方もなく強力なスーパーコンピューターである。

 その解析対象も凄い。氷床コアから動物のフンまで、世界中の研究者が13年かけて集めた生物サンプル570万個から得られた遺伝子配列データで、そのボリュームは2000万ギガバイトに及ぶ。

 この膨大なデータを圧倒的な演算能力で解析し、その中に未知のウイルスの存在を指し示している遺伝子がないか探す。その結果、まだ知られていない13万2000種のRNAウイルスが確認されたという。

 これまでに判明しているRNAウイルスは1万5000種ほど。だがこの結果は、それを大きく上回る種類のウイルスが存在していることを示している。その中には新種のコロナウイルスも9種含まれていたという。

[画像を見る]

image credit:Serratus Project

ウイルス学は新しい時代へ まだまだ膨大な数の未知のウイルスが存在するという事実は、驚異でも脅威でもある。

 研究の中心人物アーテム・ババイアン博士(ブリティッシュ・コロンビア大学)によると、ウイルス学は新しい時代に突入しているのだという。
自然界に存在するウイルスの遺伝的・空間的多様性、多種多様な動物がこうしたウイルスとどう関わっているのか、こうしたことの理解について新しい時代に突入しています
 ババイアン博士は、こうした研究は、ウイルスの不意打ちを防ぎ、今のような大流行を2度と起こさないようにすることが最終的な目的であると説明する。

 たとえば、誰かが原因不明の熱を出したとする。そんなとき、その患者の血液データを既知のウイルスの膨大なデータベースに紹介する。

 するとわずか数分で、たとえば2012年にサブサハラアフリカのラクダから検出されたウイルスが原因と特定される。今後はこうしたことができるようになると考えられるのだ。

[画像を見る]

photo by Pixabay
2000年かかる解析が11日で 今回の解析に費やされたCPU時間は、じつに2000年分にも相当する。これは従来のスーパーコンピューターならば1年の解析期間と膨大なコストがかかる大変な作業なのだが、今回のクラウドコンピューティングは、たった11日間と270万円程度で実行してしまった。

 まさに画期的な成果だが、もともとはババイアン博士が登山仲間とセラタス山に登ったとき、お楽しみとしてナプキンの裏にアイデアをメモしたことがきっかけだったという。

 このアイデアを、ブリティシュコロンビア大学とアマゾンウェブサービス(AWS)が運営しているクラウド・イノベーション・センターに持ち込んだことで、今回のプロジェクトが発足した。そのため本プロジェクトは「セラタス・プロジェクト」と呼ばれている。

References:UBC postdoc identifies over 100,000 new RNA viruses using the power of cloud computing / written by hiroching / edited by parumo

画像・動画、SNSが見れない場合はオリジナルサイト(カラパイア)をご覧ください。
編集部おすすめ