フィジカルAI企業RLWRLD(リアルワールド)が7日、独自ロボティクスファンデーションモデル(RFM)「RLDX-1」を公開した。
RLDX-1は、高自由度5本指ロボットハンドに洗練された操作能力を付与するために設計された「Dexterity-First」ファンデーションモデルだ。視覚・言語だけでなく、手に加えられる力(トルク)・触覚・作業記憶まで単一モデルで処理するという点で、視覚・言語中心の既存汎用VLA(Vision-Language-Action)モデルと構造的に差別化している。
RLWRLDによると、RLDX-1はグローバル向け公開ベンチマーク8種において、NVIDIAのGR00T(グルート)、Physical Intelligence(フィジカルインテリジェンス)のπ0(パイゼロ)などの既存モデルを上回った。長期・接触中心課題「RoboCasa Kitchen」で70.6点を記録し、ヒューマノイド専用評価「GR-1 Tabletop」では58.7点でNVIDIAのGR00T N1.6に10.7%pの差をつけた。RLWRLDが開発に参加したWIRobotics(ウィロボティクス)のヒューマノイドALLEX(アレックス)による実際のロボット環境での「コーヒーを注ぐ」課題の成功率は70.8%で、比較対象モデルの30%台水準を大きく上回ったと明らかにした。
技術的な核心は、マルチストリームアクショントランス(MSAT)構造である。各モダリティに独立したストリームを付与した後、ジョイントアテンションに統合し、単一モデルが視覚・触覚・記憶・適応を同時に処理できるように設計されている。
RLWRLDはSK telecom(SKテレコム)、LG Electronics(LG電子)、CJ Logistics Corporation(CJ大韓通運)、Lotte(ロッテ)、KDDI、ANAホールディングス、三井化学、島津製作所など日韓の主要大企業から資金調達しており、10社余りの企業とベンチマーク共同開発、概念検証(PoC)、ロボティクストランスフォーメーション(RX)を行っている。モデルの荷重値・学習コード・技術文書は、Github(ギットハブ)とHugging Face(ハギングフェイス)を通じて外部研究者に公開された。
RLWRLDのリュ・ジュンヒ代表は「ピクセルに含まれていない情報は映像をいくら収集しても現れない」とし「RLDX-1は日韓の産業現場で検証したデータと技術を元に、グローバルヒューマノイドパートナーと共に4D+ワールドモデルへと歩みを進める長いロードマップの出発点だ」と語った。
RLWRLDは13日、米国で「Dexterity Night」ローンチイベントを開催し、以後日本・韓国でも順次イベントを開催する予定だ。
