生成AIだけではない。人工知能の種類と仕組み、活用例をわかりやすく解説
Photo by:iStock

生成AIだけではない。人工知能の種類と仕組み、活用例をわかり...の画像はこちら >>

 私たちの生活に当たり前のように入り込んでいる「AI(人工知能)」。だが多くの人が思い浮かぶのは会話をしたり、画像や動画を作ってくれるChatGPのような生成AIだろう。

 AIはすでに科学や医療や交通、ビジネス、さらには考古学や地形調査にまで活用されており、その種類や学び方、働き方は目的によってまったく異なる。

 この記事では、いまさら聞けないAIの基礎知識として、「種類別に異なる仕組み」や「実際の活用例」を解説していこう。

 そして最後に、生成AIが“日本語”が苦手な理由についても説明しよう。

AIとは何か?多種多様な人工知能の世界

 「AI=ChatGPT」と思い込んでしまうのは無理もない。近年は会話型AIや画像生成AIが急速に普及し、ネット上でも目立つ存在となっている。

 だが本来、AI(人工知能)は、人間のように「学ぶ・考える・判断する・行動する」能力を、機械やコンピュータに与える技術全般を指す。

 この概念は1956年、アメリカの数学者ジョン・マッカーシーらによって提唱され、当初は「人間の知能を模倣する」ことが大きな目標だった。

 だが現在では、必ずしも人間と同じ方法で思考しなくてもよいとされ、特定の作業に特化したAI(狭義AI)が多くの分野で活躍している。

 AIには複数の「学習方法」がある。たとえば正解データを与えて学ばせる教師あり学習(Supervised Learning)や、自分でパターンを見つける教師なし学習(Unsupervised Learning)、行動と報酬を繰り返して学ぶ**強化学習(Reinforcement Learning)などだ。

 とくに近年注目されているのが、大量の文章や画像をもとに学ぶ大規模言語モデル(LLM)型のAIだ。

 このタイプのAIは、テキストをトークン(単語や文字のかたまり)に分解し、次に来るトークンを予測することで文章を生成する。たとえば「私はりんごを」のあとに「食べた」が来る確率を学習し、それを言語生成に応用している。

 この「トークン予測」による自己教師あり学習(Self-Supervised Learning)が、現在のChatGPTや画像生成AIの基盤となっている。

 だが、AIの世界はこれだけではない。次章では、生成AI以外のAIが、どんな仕組みで何に使われているのかを詳しく見ていこう。

[画像を見る]

AIの学習方法と用途の違い

以下に、代表的なAIのタイプとその学習方法、活用分野をわかりやすく解説する。

生成AI(例:ChatGPT、Gemini、Claude、DALL·E)

学習方法:自己教師あり学習(Self-Supervised Learning)+強化学習(Reinforcement Learning)、RLHF(Reinforcement Learning from Human Feedback)

仕組み:自己教師あり学習とは、「文章の一部をわざと隠し、それを予測することで文の構造を学ぶ」という方式だ。

 このAIは膨大な量の文章を読み込み、「次に来る言葉」をひたすら予測することで会話能力を身につけている。

 さらに、人間が「この回答は良い」「これは不自然」と評価するフィードバックをAIに与え、その評価をもとに回答を改善していく仕組みが強化学習(Reinforcement Learning)であり、これを人間の判断と組み合わせた方法がRLHF(Reinforcement Learning from Human Feedback)と呼ばれている。

  こうして育てられたのが、文章や画像を生み出す「生成AI」だ。言語生成を担うモデルは「LLM(大規模言語モデル)」と呼ばれ、現在の生成AIの中心的な技術になっている。

特徴:文章や画像、会話に特化している。言葉の意味そのものよりも、「どういう言い回しが自然か」「どう続ければそれっぽく見えるか」を学んでおり、あたかも人間のような表現ができるのが強みだ。ただし、正しいことを言っているとは限らない。

[画像を見る]

医療AI(例:画像診断、遠隔手術支援、疾患予測)

学習方法:教師あり学習(Supervised Learning)

仕組み:教師あり学習とは、「正解があらかじめ決まっているデータ」を使って学習させる方法だ。

 たとえば、「この画像には肺がんがある」「この検査結果は糖尿病を示している」といった、正しい答えがあらかじめ示されたデータを大量に読み込んで、「どのような特徴が異常のサインか」を学んでいく。

 近年では、X線やMRIなどの画像から病変を検出する診断補助に加え、AIが手術支援ロボットを通じて、遠隔地の医師が正確な操作を行うサポートをするシステムも登場している。

 これにより、地方や国外の専門医による治療の実現も可能になると期待されている。

特徴:診断の正確性とスピードを向上させるとともに、医師の負担を軽減する役割もある。ただし、医療現場でのAI利用には高い安全性と信頼性が求められるため、導入は慎重に進められている。

[画像を見る]

ロボティクスAI(自動運転、動作制御など)

学習方法:強化学習(Reinforcement Learning)、模倣学習(Imitation Learning)

仕組み:強化学習とは、「AIが行動を選び、その結果に応じて報酬(ごほうび)や罰(ペナルティ)を受け取りながら学んでいく方法」だ。

 たとえば自動運転車の場合、「安全に止まれたら+10点」「事故を起こしたら-100点」といったルールを与えて、何度も仮想環境で運転させ、徐々に正しい動きを学習していく。

 一方で、人間の操作データをマネして学ぶ「模倣学習」もよく使われる。これは、ロボットが「うまくできた例」を見て覚える方式だ。

特徴:ロボティクスAIは、単に「考える」だけでなく、「現実の空間で動く」能力が必要だ。そのため、センサーで環境を感じ取り、リアルタイムで判断・行動する仕組みが欠かせない。

 現在は以下のような分野で実用化が進んでいる:

  • 自動運転車:信号や歩行者、障害物を検知し、安全に走行する
  • 介護ロボット:高齢者を支援したり、感情に寄り添った対応を目指す
  • 宇宙探査ロボット:火星や月などの過酷な環境で人の代わりに作業する
  • 災害救助ロボット:倒壊建物の中など、人間が立ち入れない場所を調査する

 一方で、課題も多い。たとえばセンサーの精度や判断スピードが不十分だと、誤作動や事故につながるおそれがある。また、現実の環境は予測できない変化が多いため、**「想定外の状況に弱い」**という欠点もある。

 さらに、学習には時間がかかり、実世界での試行錯誤にはコストやリスクも伴う。

そのため多くのロボットは、まず仮想空間(シミュレーター)で訓練された後に、現実世界に適用されている。

[画像を見る]

ビジネスAI(例:売上予測、需要分析、顧客分類)

学習方法:教師あり学習(Supervised Learning)、教師なし学習(Unsupervised Learning)

仕組み:売上予測のように「正解がある」ものには教師あり学習が使われる。たとえば「この時期、この気温、この商品は〇個売れた」といったデータから、「では来月はいくつ売れるか?」を予測する。

 一方、正解のないデータ(たとえば「どんなタイプの顧客がいるか」)を扱うときは、教師なし学習が使われる。

 これは、似た特徴を持つデータを自動でグループ分けする「クラスタリング」という手法が代表的だ。

特徴:企業の意思決定やマーケティングに活用されており、在庫の最適化や新規顧客の発見にも役立っている。身近なところでは、通販サイトの「おすすめ商品」もこうしたAIによって表示されている。

 ただしビジネスAIは「過去のデータに基づく予測」が基本であるため、予測のもとになるデータが間違っていたり、極端に少なかったりすると、正しく学習できない。

 また、消費者の行動や社会情勢は突然変化することがあるが、AIはそうした「予想外の出来事」に柔軟に対応するのが苦手だ。

 さらに、AIが出した結論の理由がわかりにくい(いわゆる「ブラックボックス問題」)こともあり、説明責任が求められる業務では慎重な運用が必要とされている。

[画像を見る]

エッジAI(例:スマートフォンの顔認証、スマートスピーカー、監視カメラ)

学習方法:転移学習(Transfer Learning)+軽量化モデル(Model Compression)

 仕組み:転移学習とは、すでに大量のデータで学習されたAIモデルの“知識”を一部再利用して、新しいタスクに応用する方法だ。

 たとえば、大きなコンピュータで学習した画像認識のAIの能力を、スマホやカメラなどの小型機器に移植することができる。

 このとき使われるのが軽量化モデルで、AIの精度をある程度保ちつつ、データ容量や処理速度を落とさずに済むように圧縮されたAIモデルのことだ。これにより、小さなチップや端末でもAIが使えるようになる。

 エッジAIの最大の特徴は、「クラウドを使わず、その場(端末上)でAI処理ができる」ことだ。これにより、以下のような利点がある。

  • 応答が速い(ネットを介さないためリアルタイム処理が可能)
  • プライバシーに強い(データを外部に送らないため情報漏洩のリスクが減る)
  • ネット接続がなくても使える(離れた場所や災害時でも機能する)

 ただし小型機器には処理能力や電力の限界があり、クラウドAIに比べるとできることが制限される。

また、機器ごとに異なる環境で動くため、一律に高い精度を出すのが難しい。

 さらに、AIモデルを更新するには、端末ごとに再設定が必要なケースもあり、保守管理の手間がかかるという課題もある。

[画像を見る]

考古学・地形調査AI(例:遺跡探査、地形分析、古文書の解析)

学習方法:教師あり学習(Supervised Learning)、教師なし学習(Unsupervised Learning)、転移学習(Transfer Learning)

仕組み:考古学や地形調査の分野では、膨大な衛星画像、航空写真、3D地形データ、さらには古文書や記録文献などを対象にAIが分析を行う。

たとえば、「これは自然の地形か?人工的な構造か?」を画像から見分ける」*といった作業では、教師あり学習によって、「遺跡のある地形の特徴」などを学ばせる。

 また、AIが自動でパターンを分類する教師なし学習によって、未発見の遺跡の候補地を絞り込むこともできる。

 さらに、古い写真や文字の判別に特化したAIを再利用する転移学習により、歴史的な文献の読み取りや復元にも活用されている。

特徴:この分野のAIは、人間の目では見逃しやすい細かい地形の変化や、広大な範囲に散らばる情報を一括で処理するのが得意だ。

 例えば、衛星画像から未発見の遺跡の可能性を探ったり、中の地形を自動で3Dマッピング、崩れた石碑や文献の文字を復元したり、膨大な発掘記録や論文を読み込んで関連性を分析することが可能だ。

 こうした技術により、これまで数年かかっていた分析が数日で終わることもある。ただし課題もある。

 AIが予測した結果が正しいとは限らず、人間による検証が不可欠だ。たとえば「地形的に遺跡の可能性がある」とAIが判断しても、実際には自然地形であることもある。また、データが偏っていたり、現地での調査条件が悪いと精度が落ちることもある。

 考古学は「モノを見る目」と「歴史の解釈」が重要な学問であり、AIはあくまで補助的な役割だ。人間の専門知識とAIの処理能力をどう組み合わせるかがカギとなる。

[画像を見る]

なぜ日本語はAIにとって難しいのか?

 ところで、ChatGPTのような生成AIと会話をしていると、英語に比べて日本語の応答がやや不自然に感じることがある。

 実はこれ、日本語がAIにとって非常に難しい言語のひとつだからである。

その理由は以下のようにいくつかある

  • 単語の区切りが空白で示されていない
     英語では単語の間にスペースがあるためAIが文の構造を把握しやすいが、日本語はどこで単語が切れるのかをAI自身が推測しなければならない。
  • ひらがな・カタカナ・漢字が混在している
     たとえば「ミル」という音は、「見る」、「診る」、「観る」など、まったく違う意味になる。これを判断するには高度な文脈理解が必要となる。
  • 学習データの中心が英語である
     多くの大規模言語モデルは、英語を中心に学習されている。日本語のデータは相対的に少ないため、表現のバリエーションや文法処理で精度が落ちることがある。

 こうした理由により、日本語はAIにとって「やさしくない言語」とされている。ただし、日本語特化型のAIモデルの開発も進んでおり、今後は自然な対話がさらに可能になると期待されている。

編集部おすすめ