大韓民国の「AI強国トップ3」への跳躍を牽引する独自のAIファンデーションモデルプロジェクトが初の評価に突入する。政府のGPU・データ投資と民間の技術力が集結し、約4ヶ月で大規模なAIモデルを開発したことで、グローバルAI市場における韓国の存在感も大きくなっている。5つの精鋭チームが開発した韓国型「Sovereign AI(ソブリン)AI」を分析し、2027年に誕生する国民AIの輪郭を描く。
「最も韓国的でありながらグローバルな競争力を備えたオープンソースAI(人工知能)モデルです」
「国家代表AI精鋭チーム」として一歩踏み出したAIスタートアップ、Upstage(アップステージ)は自社開発した巨大言語モデル(LLM)「Solar Open 100B(ソラオープン100B)」について「韓国語を誰よりもよく理解しながらも世界的性能を目指したモデル」と説明した。
Upstageは昨年8月、科学技術情報通信部の「独自AIファンデーションモデルプロジェクト」に選定された5つの精鋭チームのうちの1つである。大企業やIT企業など15チームが競争した中、Upstageは唯一のスタートアップ主管社として、Lablup(レブルアップ)、notaAI(ノータAI)、Law&Company(ローアンドカンパニー)などとコンソーシアムを構成した。
Solar Openの核心は「韓国語理解力」と「専門分野への活用性」だ。日常会話を超え法律・医療・金融など高難度領域でも実際の業務に適用可能な正確性とコンテキスト理解能力を強化した。 「フロムスクラッチ」方式で開発され、韓国語の文法と文化的ニュアンスを反映した学習戦略を通じて、単純な翻訳型モデルではなく「韓国語思考」を実装することを目指した。
このような戦略は性能でも立証された。UpstageによるとSolar Open 100Bは中国のDeepSeek(ディープシーク)の「R1」モデルと比較して韓国語(110%)、英語(103%)、日本語(106%)など主要多言語ベンチマークで優れた成果を記録した。Solar OpenのモデルサイズはDeepSeek R1の約15%レベルに過ぎない。
学習には約20兆トークン規模のデータが投入された。韓国語・英語・日本語をはじめ、プログラミングコード、数学問題、医療・法律・金融分野の高品質データが選別的に活用され、多段階検証を経て良質のデータを確保したとという。
モデルアーキテクチャは効率と安定性を最優先に設計された。限られたグラフィック処理装置(GPU)リソースで性能を最大化するために、大規模な専門家混合(Mixture-of-Experts・MoE)構造を適用し、演算コストと学習負担を減らした。モデル規模を1000億個のパラメータに設定したのも、限られた時間とリソース内でグローバル競争力を確保できる現実的な選択だったと説明される。
Solar Openはすでに「AskUp(アスクアップ)」、「Solar Open Search(ソーラーオープンサーチ)」、「Solar Deep Research(ソーラーディープリサーチ)」などのサービスに適用されている。金融決済院・Law&Company・VUNO(ビューノ)などと金融・法律・医療・製造・公共分野事業実証(PoC)も進行中だ。
Upstageは安全性と責任も強調した。有害・偏向応答を防ぐためのガイドラインを適用し、学習段階から安全応答とバランスのとれた情報提供を訓練した。
最近浮上した中国AIモデル盗作論議について、Upstageは「統計的検証方式の誤りから生まれた誤解」だと釈明した。開発前のプロセスを記録した学習ログと内部資料を公開し、現場検証を通じてフロムスクラッチ方式の独自開発モデルであることを立証したと強調した。Upstageは「今回の検証過程を通じて、むしろ透明性と信頼を確保するきっかけになった」と強調した。
Upstageは「Solar Openはみなに開かれた韓国語AIモデル」だとし、『オープンソースベースで公開されたSolar Openを通じて、韓国AIエコシステム全般の活用性と革新を広げ、韓国語に最適化された世界的レベルのAIとして国民が体験できる変化を作る」と明かした。
<グラフィック=Upstage「Solar Open 100B」詳細概要/ユン・ソンジョン>
原文:https://www.unicornfactory.co.kr/article/2026011408520523899
