AIスタートアップHugging Faceがオープンソースのロボット開発プロジェクト開始を発表 最近加熱している生成AIとロボティクスを融合させる取り組みの最前線

Hugging Faceがオープンソースのロボット開発プロジェクトを開始

機械学習やAIのオープンソースリポジトリを運営するニューヨークのAIスタートアップ、Hugging Faceが、新たなロボティクスプロジェクトを立ち上げた。2024年3月の報道によると、テスラで人型ロボット「オプティマス」の開発に携わっていたサイエンティストであるレミ・カデネ氏が同プロジェクトを主導するという。

カデネ氏がX(旧ツイッター)で述べたところでは、このロボットプロジェクトはオープンソースになるとのこと。
Hugging Faceは、ChatGPTの競合となるチャットAI「HuggingChat」をオープンソースで公開するなど、AIの「オープンソース化」を推進しており、新しいロボットプロジェクトもこのポリシーに準拠するものになるようだ。

どのようなロボットを開発しようとしているのか、同社が公開しているロボティクスエンジニアの求人情報から、その一端をうかがうことができる。

この求人で求められるのは「機械学習/AIに特化したロボティクスエンジニア」。「ディープラーニングとembodied AI(身体性を持つAI)を統合したオープンソースかつ低コストのロボットシステムの設計、構築、維持」を担う役職の求人となる。

特に重要なキーワードとなるのが「embodied AI(身体性を持つAI)」だろう。これは、AIシステムの一種だが、コンピュータのみで完結するシステムではなく、物理的な実態を持ち、現実世界と相互作用できるAIシステムのことを指す。
簡単にいうと、知能を持つロボットのこと。特徴は、カメラ、マイク、センサーなどを通じて、周辺環境から情報を収集し、それを処理しつつ、ロボットアームなどによって現実世界で行動を起こすシステムだ。

既存のロボットはルールベースのプログラミングや特定のタスクに特化したアルゴリズムによって行動が規定されるが、embodied AIはディープラーニングにより、経験から学習する能力を持ち、また自然言語による指示の理解ができる点で大きく異なる。つまるところ、Hugging FaceはOpenAIが支援するFigureなどと同様に、人間の言葉を理解し、現実世界で行動を起こせるAIロボットの開発を進める計画であることがこの求人情報から読み取ることができる。

Hugging Faceのこの動きは、これまでソフトウェアを中心としてきた同社にとって、大きな方向転換と野心的な事業拡大を示すもの。特に、FigureがOpenAIなどから6億7,500万ドルの大型資金調達を実施したことからも分かるように、投資家の関心が急速に高まっている領域であり、Hugging Faceは、このプロジェクトを通じて、さらなる資金獲得とAI業界でのポジション確立を目指す構えのようだ。


Figure、OpenAIが先行するロボットと生成AIの融合取り組み

Hugging Faceに先行して、ロボットと生成AIの融合に取り組むプロジェクトはいくつか存在している。とりわけ注目されているのがロボットスタートアップのFigureとOpenAIの共同プロジェクトだろう。

Figureは、ボストン・ダイナミクス、テスラ、グーグル・ディープマインド、Archer Aviationの元従業員らが2年足らず前に設立した新しい企業。直近の7億ドル近い資金調達により、評価額はすでに26億ドルに達したと報じられている。

同社は2024年3月、OpenAIとの共同プロジェクトの成果を公開し大きな話題を呼んだばかり。Figure共同創設者兼CEOのブレット・アドコック氏がXに投稿した動画デモ(YouTubeでも公開)では、プロトタイプであるFigure 01と呼ばれる人型ロボットが、近くにいる人間とやり取りし、指示に従ってりんごを渡したり、ゴミを拾ったり、皿を乾燥ラックに入れたりする様子が示されている。アドコック氏によると、「Figureのオンボードカメラが捉えた映像がOpenAIによってトレーニングされた大規模ビジョン言語モデル(VLM)にフィードされている」という。


Figureの動画デモ

Figureのデモ動画は、人型ロボットが人間と自然なやり取りを行い、指示を直感的に理解しつつ、スムーズに行動する様子を示しており、人型ロボットの対話型インタラクションにおける大きな前進と捉えられている。このプロトタイプが実用化・商用化に向けどこまで進化するのかが注目されるところだ。

ただアドコック氏自身も、このロボット開発には数十億ドルの投資やエンジニアリングイノベーションが必要となり、失敗のリスクも高いと認めるところであり、短期間での商用化は難しいのかもしれない。

テスラ、1Xなども人型ロボット開発へ

Hugging FaceやFigure以外にもAI搭載の人型ロボットを開発するプレイヤーが存在する。

冒頭でも触れたが人型ロボット「オプティマス」を開発するテスラはその1つ。2024年1月に発表された最新デモ動画では、オプティマスがテーブルの上でTシャツをたたむ様子が公開された。


動画では、人がロボットを操作している様子が映り込んだため、その自律性に疑問が呈されていた。これに関してマスク氏は、オプティマスが自律的に動作していないことを認めているという。今後、現状を踏まえ完全自律的に動作するように、開発をさらに加速する構えのようだ。

2024年1月、OpenAIなどを引受先とする1億ドルのシリーズBラウンド資金調達を発表したノルウェーのロボットスタートアップ1X Technologiesも注目株の1つ。

1X Technologiesは10年前に設立され、当初は労働集約型タスクを処理する汎用ロボットの構築を目指していたが、2022年OpenAIとの提携を機に、大規模言語モデルを使ったAIロボットの開発にシフトした。前出のembodied AIの範疇となり、ユーザーによる自然言語指示を理解し、それを処理するAIロボットが開発の中心になった。


主力は「Eve」と「Neo」の2モデル。Eveは産業向けにデザインされたロボットで、モノを運んだり、ドア開閉などのタスクをこなすことができるという。すでに複数の企業で導入されているとのこと。一方Neoは、コンシューマ向けに設計された二足歩行ロボットで、掃除、片付け、雑用などの日常タスクをこなすことができるモデル。現在、開発段階にある。どちらのモデルも自律的に動くことができるが、ロボットの暴走などに備えて、同社はリモート制御のオプションを残しているという。


デモ動画や実績を見る限り、この領域ではFigureと1X Technologiesが一歩リードし、それにテスラが追随している状況といえるだろう。そして、Hugging Faceが新たに参入した格好となる。人型ロボットや汎用ロボットの開発は活発化しており、生成AIとの融合は今後ますます加速しそうだ。ただし遠隔操作などの「安全装置」が併用されている状況を鑑みると、安全かつ完全な自律化にはまだ時間がかかりそうだ。

文:細谷元(Livit