中国国際ビッグデータ産業博覧会の期間中の8月29日、中国科学院地球化学研究所は「月科学マルチモーダル専用大規模言語モデルV2.0」を発表した。この組み込み型の大規模言語モデルが構築されたことで、クラウドプラットフォームの「デジタルムーン」に、高効率で稼働する「スマートブレイン」が提供されることになる。
月の地質学的進化を研究するためには、クレーターといった地質構造の分析が必要となる。クレーターの数や大きさ、深さ、形態といった特徴は、過去に月で起きた衝突の歴史やその影響を分析するための重要な手がかりとなる。
中国科学院地球化学研究所の劉建忠(リウ・ジエンジョン)研究員は、「月には直径1キロ以上のクレーターが100万カ所以上あることが確認されているが、直径1キロ以下のクレーターの数となると、現時点では正確に統計することができない。人間の手作業で全てのクレーターを識別するのはほぼ不可能」と説明する。
月科学専用の大規模言語モデルを導入することで、研究効率が大幅に高まっている。研究者は月のクレーターの画像と関連する質問を入力するだけで、大規模言語モデルがクレーターの形態やサイズ、形成時期などについて回答し、同時に詳細なテキスト記述も生成できる。
記者発表イベントにおいて、劉氏は「月科学専用の大規模言語モデルの研究過程で、完全に体系化されたマルチモーダルデータラベリング規範を構築した。それには、月のクレーター8700個や月の他の構造7272個のラベリングされたコマンドデータセットが含まれている。モデル訓練の面でも画期的な進展を遂げている。大規模言語モデルのクレーターの年代分類や細分類の正確度は88%に達している。また、月の構造の自動認識タスクの正確度は93%に達している」と説明した。
プロジェクトでは、「デジタルムーン」は2027年までに完成し、世界に向けて開放・共有される計画となっている。(提供/人民網日本語版・編集/KN)