─ 日本のAI開発、学習データの「質と量」がボトルネックに。特に“ありえない状況”のデータ収集は限界、高精度AI実現の壁に。


[画像1: https://prcdn.freetls.fastly.net/release_image/101429/41/101429-41-23d20875bed403a42eca1b178e3a8341-600x328.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


 3DCGとAI技術で産業界のDXを推進する株式会社ORENDA WORLD(本社:東京都港区、代表取締役社長:澁谷 陽史、以下 ORENDA WORLD)は、この度、国内のAI開発における課題を分析しました。多くの企業がAI開発に取り組む中で、その精度向上に不可欠な学習データの「質」と「量」を確保することが、開発における深刻なボトルネックとなっている実態が明らかになりました。特に、ロボットアームや自動運転、ドローンなどで必要とされる「通常では起こりえない危険な状況」や「希少な状況」のデータを現実世界で収集するのは極めて困難です。ORENDA WORLDは、この課題を解決する新たなソリューションとして、3DCG空間で高品質な学習データを無限に自動生成する「YAKUDATA」を提言します。
■調査の背景
 「AIの性能は、学習データの質で決まる」。これはAI開発における常識です。しかし、多くの企業が、この最も重要な「データ」の収集と加工(アノテーション)に膨大なコストと時間を費やし、開発が停滞する「データ格差」に直面しています。

 特に、製造ラインでの異常検知や、自動運転における危険回避など、人命や品質に関わるクリティカルなAIを開発するには、「現実ではめったに起きないが、AIには学習させておきたい」状況のデータが不可欠です。ORENDA WORLDは、この課題に対し、ゲーム開発で培った3DCG技術による革新的な解決策を探るべく、本分析を実施しました。

■調査サマリー
- AI開発の成否を分けるのは学習データの「質」と「量」。しかし、その確保は多くのプロジェクトで最大の課題に。
- 現実世界でのデータ収集は限界。
特に「危険・希少な状況」のデータ収集が開発の壁に。
- 3DCG空間なら、天候・時間・モノの配置を自在に操り、“ありえない状況”の学習データを無限に生成可能。


■【分析結果1】AI開発の成否を分ける「データ収集」という高い壁
 AI、特に自動運転や外観検査などで活用される画像認識AIの開発において、プロジェクト全体の工数の7割をデータ収集・加工(アノテーション)作業が占めるとも言われています(※注1)。

 AIモデルの精度を高めるには、多様なバリエーションを持つ、何十万、何百万という大量のデータが必要ですが、これをすべて現実世界で撮影・収集するのは非現実的です。多くのプロジェクトが、データ収集と、そのデータに意味付けを行う「アノテーション」作業に開発リソースの大半を奪われ、本来注力すべきAIモデルの改善に手が回らないという本末転倒な事態に陥っています。AI人材の確保と並び、このデータ確保の問題は、AI開発における根深い課題なのです。

■【分析結果2】「もしも」のデータが作れない。現実世界の限界

[画像2: https://prcdn.freetls.fastly.net/release_image/101429/41/101429-41-b4be79cbcc71db0ed96d2eef509d19ef-600x600.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


 AIの堅牢性、すなわち予期せぬ状況への対応能力を高めるには、「もしも」の状況を学習させることが不可欠です。例えば、自動運転AIには「豪雨の中、夜間に歩行者が飛び出してくる」ケースを、産業用ロボットには「照明の反射で製品の傷が見えにくい」ケースを学習させる必要があります。

 しかし、こうした“レアケース”を現実世界で意図的に発生させ、撮影することは極めて困難であり、危険も伴います。この「レアケースデータの不足」が、AIの社会実装における安全性の担保を難しくしている大きな要因なのです。
■株式会社ORENDA WORLD考察コメント
 我々は、AI開発におけるデータ問題を「創造力の限界」ではなく「創造手段の限界」だと捉えています。
開発者がどんなに「もしも」の状況を想像できても、それを学習データとして「創造」する手段がなければ、AIの性能は頭打ちになります。

 この壁を突破するのが、3DCG技術です。仮想空間ならば、物理法則に縛られることなく、あらゆる環境を自在にコントロールできます。太陽の位置、天候、物体の配置や材質、経年劣化の度合いまでをパラメータとして変化させるだけで、何百万通りもの「ありそうでなかった」学習データを瞬時に、かつ正確なアノテーション付きで自動生成できます。これは、AI開発のプロセスを根本から変えるゲームチェンジャーです。
■解決策のご提案:AI学習データ自動生成ソリューション「YAKUDATA」

[画像3: https://prcdn.freetls.fastly.net/release_image/101429/41/101429-41-9112e9864829c501bb8ef17cc860be86-600x328.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]


 ORENDA WORLDのAI学習データ自動生成ソリューション「YAKUDATA(ヤクデータ)」は、この「データの創造」の限界を解決するために開発されました。 リアルな3DCG空間内でお客様が必要とする環境や物体をシミュレーション。天候や照明などの環境を自在に変化させながら、AI学習に必要な大量の画像データを自動生成します。現実では収集不可能なレアケースのデータを網羅的に生成することで、AIの精度とロバスト性(頑健性)を飛躍的に高めます。

 ORENDA WORLDは「YAKUDATA」を通じて、AI開発のボトルネックを解消し、より安全で高精度なAIが活躍する社会の実現に貢献してまいります。

「YAKUDATA」サービスサイト: http://yakudata.orenda.co.jp/

※注1 出典:EGG JAPAN(三菱地所)「世界No.1のAI学習データ提供企業「アッペン」が日本に本格参入。その勝算と日本企業がGAFAMに勝つための秘策とは。」 より引用:https://www.egg-japan.com/voices/appen

【株式会社ORENDA WORLD】
「デザインとテクノロジーを用いて、人々に感動と心揺さぶる体験を届ける」をビジョンにかかげ、ゲーム開発における技術を活かして社会課題を解決するソリューションを提供している。

コンピューターグラフィックス・映像分野とコラボレーションさせた、デジタルヒューマン・メタバースコンテンツへの音声合成技術の活用にも積極的に取り組む。

会 社 名:株式会社ORENDA WORLD
設    立:2015年7月15日
所 在 地:東京都港区北青山一丁目3番6号 SIビル青山
U R L:https://orenda.co.jp/
代 表 者:代表取締役 澁谷陽史
事業内容:AIソリューション事業、デザイン開発事業、地方創生事業企業プレスリリース詳細へ : https://prtimes.jp/main/html/rd/p/000000041.000101429.htmlPR TIMESトップへ : https://prtimes.jp
編集部おすすめ