大ヒットSF小説「三体」80万字をわずか数秒で要約!中国の大規模言語モデル、超長文処理の時代へ

話題の中国の人工知能(AI)企業「月之暗面(Moonshot AI)」は3月18日、同社が開発した大規模言語モデル(LLM)に基づく生成AI「Kimi」が200万字の長文に対応できるようになったと発表した。5カ月前の公開当初の対応文字数20万字の10倍にあたる。

Kimiのアップグレードは、長文対応の大規模言語モデル「LLLM」分野の競争が激化するきっかけとなった。

話題の中国LLMユニコーン「Moonshot AI」、独自のAIチャットボットが200万字の超長文対応可能に

アリババグループはこのほど、同社の生成AI「通義千問(Tongyi Qianwen)」が最大1000万字の長文処理能力を完全無料で一般公開すると発表した。これにより、金融や医療、科学研究分野に携わるユーザーが、より迅速に重要なキーワードを抽出し、文書の要約や資料をまとめる時間を節約できるようになる。 

百度(バイドゥ)もこのほど、4月から同社の生成AI「文心一言(ERNIE Bot)」が200万~500万字の長文処理機能を無料公開すると発表した。従来の最大2万8000字に比べ、処理能力が100倍以上に向上した。

処理能力を具体的に示すと、Kimiは20万字の長編小説を約20秒でまとめられる。

通文千義ならば、約80万字の超長編SF小説「三体」を数秒で要約できる。

大ヒットSF小説「三体」80万字をわずか数秒で要約!中国の大...の画像はこちら >>
「通文千義」によるSF小説「三体」の要約

ちなみに、米OpenAIの「GPT-4 Turbo-128k」が処理可能なテキストは漢字約10万字、長文に特化した米Anthropicの「Claude3-200K」でも約16万字だという。

長いコンテキストを扱えるようになれば、生成AIアプリの使い勝手や専門性は高まる。しかし、処理可能なコンテキストが長いだけでは不十分で、ユーザーは記憶や推論の能力も求めている。長さを過度に追求すると、演算能力の不足につながる可能性もある。

(36Kr Japan編集部)