国立大学法人九州大学、ソフトバンク株式会社および株式会社豆蔵は、企業や自治体、教育・研究機関などで蓄積されているさまざまなデジタルデータ(以下、データ)について、データの品質を数学的な理論を用いて客観的に判定し、格付けとして明示する「データ格付け」の実現に向けた共同研究を、2020年11月から開始したと発表した。
3者は、「データ格付け」により産官学が保有するデータの品質を明確化することで、データの相互利用の促進や、データ流通市場の活性化を目指す。■共同研究の背景と狙い
昨今、官民を挙げてさまざまな分野でDX(デジタルトランスフォーメーション)が推進されている。こうした中、企業や自治体、教育・研究機関などが組織内で記録・蓄積しているデータの相互利用は、DXにおける重要なテーマの一つとなっている。しかし、各組織が保有するデータは仕様や形式が異なる他、そのデータが利用に適した品質であるかどうかが明示されていないため、データを分析する際には、形式上の整合性の確認や、重複や誤記、表記の揺れなどを探して修正・削除するデータクレンジングなどの作業が必要になり、データの相互利用における大きな障壁となっている。今回、九州大学、ソフトバンクおよび豆蔵の3者は、こうしたデータの相互利用における障壁を取り除くため、データの品質を数理的に判定して明示する「データ格付け」の実現に向けた共同研究を行う。「データ格付け」によってデータの品質を明確化することで、データの相互利用の促進やデータ流通市場の活性化が見込める他、さまざまなデータを掛け合わせた新たなビジネスの展開や、企業や自治体、教育・研究機関のさらなるDX推進につながると考えられるとのことだ。
■共同研究の内容
共同研究では、「データ格付け」を行うための新しい数理基盤(アルゴリズム)を確立するとともに、クラウド環境と連携した「データ格付けサービス」の実装に向けた理論の構築と実証実験を行う。「データ格付けサービス」とは、クラウド環境にある各種データの品質を数理的に判定し、格付けとして明確化するサービスだ。このサービスを実装するためには、「データ格付け」を可能な限り自動化することが必要なため、数理基盤やAI(人工知能)の活用を想定している。データが形式的な要件を満たしているかどうかを数理基盤で判定し、データ利用者に提供可能な品質かを自動で格付けする他、AIの活用によりデータの品質を保証する仕組みも検討する。なお、この共同研究において、「データ格付け」の理論構築は九州大学と豆蔵が主担当となり、理論の実装および実証実験は、九州大学とソフトバンクが主担当として実施する。「データ格付けサービス」のイメージvia プレスリリース
■今後の予定
今後3者は、下記のスケジュールで共同研究を進めていく予定だという。数理基盤や理論の構築:2021年1月まで
実証実験の環境構築 :2021年5月まで
実証実験の実施 :2021年7月まで