株式会社ジーニー(本社:東京都新宿区、代表取締役社長:工藤 智昭、以下ジーニー)のグループ会社である、AIを活用したプロダクト開発・販売を行うJAPAN AI株式会社(本社:東京都新宿区、代表取締役社長:工藤 智昭、以下JAPAN AI)は、画像とテキストを統合的に理解するマルチモーダルRAGを実装したことをお知らせします。
画像 : https://newscast.jp/attachments/Hi4Ru9qHw9at9XaqKjvr.png
■本機能の実装背景
これまでJAPAN AIでは、製造業を含む多くの企業のAI導入と伴走支援を実施してまいりました。
その中でも多くの製造業を営む企業においては、技能継承と知見活用の課題に直面していることが明らかになっています。製造業では熟練技術者の持つノウハウや経験値が非常に大きな役割を果たします。
しかし、技術者の退職や異動で、設計図面、作業手順書、品質管理データ、過去のトラブル対応事例などの膨大な技術資料が社内には存在するものの、長年蓄積された技術的ノウハウや経験値が部門や個人へ分散して管理され、必要な時に適切な情報にアクセスすることが困難な状況となってしまうケースが多発しています。
JAPAN AIでは、業界最高水準の82.7%の精度を誇るRAG: https://japan-ai.co.jp/news/press/2025/04/250428/(※)でテキスト情報検索の支援を行ってきましたが、図面や写真、グラフなどの視覚的情報に含まれるデータについては、従来のRAGでは取得できる情報が限られており、貴重な活用機会が失われていました。
このような背景から、画像とテキストを統合的に理解する「マルチモーダルRAG」の実装に至りました。
※:約300の質問に対する回答の正答率
■マルチモーダルRAGとは
マルチモーダルRAG(Retrieval-Augmented Generation)は、画像・文書・音声など複数のデータ形式を検索して、その結果を元に生成AIが回答を出力する仕組みです。
従来のRAGでは、社内に点在していた図面などの技術文書を検索して見つけることはできましたが、その図面に記載された具体的な数値や仕様を抽出し、回答を生成することは困難でした。
今回マルチモーダルRAGが実装されたことで、PDFファイル内のテキストと画像を自動判別し、両方の情報を統合的に理解して、回答を生成することができるようになりました。従来のテキスト抽出やOCRによる画像認識のみの処理から大幅に進化し、図面の詳細な寸法情報やグラフのデータなどの情報を理解して読み取ることが可能となります。
(※本実装は文書と画像の2つの形式に対応)
画像 : https://newscast.jp/attachments/iS3XMiZAhsjZsAk472AN.png
■具体的な使用例
PDFファイルをアップロードすると、システムが高度な画像解析技術を用いてテキスト部分と画像部分を自動判別し、それぞれに最適化された処理を実行します。
〈使用例① 図面検索〉
図面検索機能では「船舶の設計図面で全長50メートル級の事例を探して詳細な仕様を教えて」といった具体的な条件での検索が可能になり、該当する図面を特定するとともに「全長52メートル、全幅8メートル、喫水3メートル、総トン数450トン、エンジン出力1200馬力」といった詳細な寸法情報や仕様データが自動的に抽出されて出力されます。設計者は過去の類似事例を効率的に参照でき、新規設計の参考資料として活用できるようになります。
〈使用例② グラフ理解〉
「四半期売上推移のグラフから2023年第3四半期の数値を教えて」という質問に対し、グラフの画像を詳細に解析して軸の値や線の位置を読み取り、「2023年第3四半期の売上は前年同期比15%増の1,200万円で、前四半期比では8%の増加を記録しており、年間目標達成に向けて順調な推移」といった具体的な数値データと傾向分析を含めた包括的な回答を提供します。
■JAPAN AIの今後の展望
過去の設計事例に基づいた最適な業務改善提案機能や、過去の設計図面と見積を参照して、類似製品製造時の見積を作成できるようなAIエージェントの開発も予定しております。今後も、より複雑な図面や多様なグラフ形式への対応範囲を拡大できるようRAG技術の向上に努めてまいります。単なる情報検索を超えた知識活用支援システムとして、製造業をはじめとする各業界の業務効率化と技術革新に貢献してまいります。
■JAPAN AIのサービス概要
JAPAN AI AGENT
設定した目標やゴールに対し、AIが自ら思考し、特定のタスクを実行するAIシステム。日常的に発生する様々なタスクを自動化することができます。
サービスサイト:https://japan-ai.co.jp/agent/
JAPAN AI MARKETING
広告運用業務を包括的に支援するAIエージェントです。BigQuery連携による自動データ取得から、分析、レポーティングまでを一気通貫で実行します。広告代理店やマーケティング担当者の業務効率を大幅に向上させ、戦略的な意思決定に注力できる環境を提供します。
サービスサイト:https://japan-ai.co.jp/marketing/
JAPAN AI SALES
営業部門における日々の活動記録をAIが自動的に顧客管理システムへ入力するAIエージェントです。商談やメールのやり取りをAIが分析し、必要な情報を適切な形式で顧客管理システムに反映します。
サービスサイト:https://japan-ai.co.jp/sales/
JAPAN AI CHAT
最新の言語モデルを使用した法人向け生成AI活用プラットフォームです。
サービスサイト:https://japan-ai.co.jp/chat/
JAPAN AI SPEECH
議事録を自動で生成するAIサービスです。業界用語への対応や話者分離など、議事録として必要な機能はもちろん、文字起こしした文章をAIにより様々な形に要約・編集できる機能を備えています。
サービスサイト:https://japan-ai.co.jp/speech/
JAPAN AI CONSULTING
業界最高水準のAI開発技術とAIプラットフォームを起点に、企業の課題発掘からAI利活用の起案、実用化、社内浸透までを伴走支援。企業のAX(AIトランスフォーメーション)の実現を目指します。
サービスサイト:https://japan-ai.co.jp/consulting/
■会社概要
社 名:JAPAN AI株式会社
代 表 者:代表取締役社長 工藤 智昭
本 社:東京都新宿区西新宿6-8-1 住友不動産新宿オークタワー5/6階
設 立:2023年4月14日
事業内容:人工知能の研究開発、人工知能に関するコンサルティングサービス
URL:https://japan-ai.co.jp/
■ジーニーについて
ジーニーは、「誰もがマーケティングで成功できる世界を創る」、「日本発の世界的なテクノロジー企業となり、日本とアジアに貢献する」という2つのPurpose(企業の存在意義)のもと、企業の収益拡大・生産性向上など様々な課題解決につながるソリューションを開発・提供するマーケティングテクノロジーカンパニーです。
【会社概要】
社 名:株式会社ジーニー
代 表 者:代表取締役社長 工藤 智昭
本 社:東京都新宿区西新宿6-8-1 住友不動産新宿オークタワー5/6階
設 立:2010年4月
資 本 金:100百万円(連結、2025年3月末現在)
従業員数:877名(連結、2025年3月末現在)
海外拠点:米国、インド、シンガポール、ベトナム、インドネシア、UAE
事業内容:広告プラットフォーム事業、マーケティングSaaS事業、デジタルPR事業
U R L:https://geniee.co.jp/
■本件に関する報道関係のお問い合わせ先
株式会社ジーニー 広報担当
TEL : 03-5909-8177
MAIL : pr@geniee.co.jp