人工知能(AI)データ及びソリューション専門企業Flitto(フリット、イ・ジョンス代表)が、国立国語院が主管する「2026年韓国語-外国語コーパス構築事業」の遂行企業に選定され、事業に着手した。
「韓国語-外国語コーパス構築事業」は、AI時代に韓国語中心の言語データ主権を確保し、通・翻訳や音声認識など、AI言語技術の開発を支援するために推進する国立国語院の大規模データ構築プロジェクトだ。
今回の事業は慶煕(キョンヒ)大学産学協力団が主管し、Flittoは共同遂行業者として参加する。総事業規模は約38億ウォン(約4億750万円)で、Flittoはこのうちテキスト545万語節と音声50万語節を合わせた計595万語節のパラレルコーパスの構築を担う。対象言語は、ベトナム語、インドネシア語、タイ語、ヒンディー語、クメール語、タガログ語、ロシア語、ウズベク語、英語の既存の9ヶ国の言語に新たにアラビア語を追加し、計10の言語で行われる。
今年の事業は、AI通訳技術の高度化のため、既存の文章単位の構築方式から段落単位の変換方式に高度化し、パラレルコーパスを構築する。また、既存の9つの言語に対するSTS(Speech to Speech)ベースのコーパスを併せて構築し、AI音声インターフェースの性能向上を図る。これと共に、新規言語や類型に合わせた評価基準の整備、翻訳プラットフォームの改善など、データの精製と検収体系の高度化のための研究も並行して進める。
Flittoは、長年にわたって蓄積したデータの精製ノウハウを基に、国立国語院の核心パートナーとしての役割を果たしてきた。今回の事業を通じて構築されるデータまで含めると、Flittoの音声含む累積構築語節は約6100万個に達する見通しだ。
構築されたデータは韓国語と東南アジア地域の言語のデータ不足問題を解消し、韓国内外のAI研究及び技術の商用化の中核資源として活用される。これにより、グローバルAI技術の格差を解消し、文脈の理解と推論能力を備えた次世代翻訳モデルの開発につながることが期待されている。
Flittoのイ・ジョンス代表は「Flittoの言語データの専門性と品質管理能力が認められ、今年の事業にも参加することになった」とし、「政府や研究機関との持続的な協力を通じて高品質AI言語データを供給することで、グローバル市場で韓国型AIモデルの競争力を確保することに貢献していく」と話した。
<写真提供:Flitto>
