中国の国家発展改革委員会、国家データ局、財政部、人的資源・社会保障部の4つの政府機関は13日、共同で「データ注釈産業の質の高い発展の促進に関する実施意見」を発表しました。これは2027年までにデータ注釈(機械学習アルゴリズムがデータの処理や分類を理解できるよう、データにタグ、属性、ラベルなどを付与するプロセス)産業の専門化やスマート化および科学技術革新能力のレベルを顕著に引き上げ、産業規模を大幅に拡大し、年平均複合成長率を20%以上にすることを計画しています。

「意見」は、データ注釈という新興産業を国家レベルで初めて体系的に計画したものです。自動運転、低空経済、スマート製造、インテリジェント医療などの分野はデータ注釈が欠かせません。推計では、2023年までに中国のデータ注釈産業規模は800億元(約1兆7200億円)前後に達したとのことです。

清華大学計算社会科学・国家管理実験室の孟慶国執行主任によると、データ注釈はデータのスクリーニング、クリーニング、分類、タグ付けなどさまざまな加工処理を実施して、機械が比較的速く理解し、学び、訓練できるよう高品質のデータセットを生成します。現在、データ注釈自体の自動化、スマート化のレベルは明らかに向上しており、同時に細分化された分野が増え、金融、交通、エネルギー、医療などのノウハウを持つ専門人材も必要となっています。データ注釈は伝統的な労働集約型から知識集約型産業へと徐々に転換しています。(提供/CRI)

編集部おすすめ