株式会社セゾンテクノロジー(本社:東京都港区、代表取締役 社長執行役員:葉山 誠、以下セゾンテクノロジー)は、生成AIのRAG(検索拡張生成)*1として読み込む社内データを事前加工する「HULFT Square」向けデータ連携スクリプト、「AI前処理テンプレートシリーズ」10種類を、7月23日より順次提供開始します。
本テンプレートを利用することにより、スプレッドシート、マニュアル、スキャンPDF、画像データ、音声データ、HTMLなど、社内に存在するさまざまな業務データから、タグなどの不要なノイズを除去したテキストの抽出や、非構造化データの構造化データへの変換、およびデータに適切なリレーションなどを付与します。
背景
近年、企業における生成AIの活用が進んでおり、大規模言語モデル(LLM)に新たに社内データの情報を組み合わせ、生成AIの検索精度を向上させるRAGの手法が拡がっています。一方で、社内データを生成AIに参照させたものの、当初期待したよりも回答の精度が得られていないことが多いのも実情です。
社内データを生成AIに最適な「AI Ready」なデータとするためには、生成AIが理解しやすい構造に加工したり、データに適切な意味づけを付与したりするなど、エンジニアがデータの種類に応じてさまざまな手法で事前にデータを前処理する必要があります。このデータ加工処理に必要なノウハウや作業工数の確保が、社内データを迅速に生成AIで活用し、高い回答精度も得るための課題となっています。
「AI前処理テンプレートシリーズ」の概要
生成AIに最適なデータに加工する「AI前処理テンプレートシリーズ」は、データ連携プラットフォーム(iPaaS)「HULFT Square」上で利用できるデータ連携スクリプトである「HULFT Squareアプリケーション」として提供されます。
社内データの種別に応じて10種類の「AI前処理テンプレートシリーズ」を利用することで、「HULFT Square」経由で生成AIとデータを連携させ、テキスト抽出やデータ変換、データの意味づけなどの事前加工の作業を生成AI自体に任せることで、RAGとしてデータを読み込むために必要な生成AIが理解しやすい状態に社内データを前処理することが可能です。
「AI前処理テンプレートシリーズ」の特長と種別および処理内容の概要は次の通りです。
- さまざまな社内データを生成AIが理解しやすい状態に事前加工し回答精度が最大90%*2まで向上
- ノウハウが必要なデータ加工の前処理をHULFT Square経由で生成AI側が実行し加工作業を50~60%程度*3省力化
■回答精度の向上
[表1: https://prtimes.jp/data/corp/118454/table/87_1_2802de80db462ff4560c03d335a666c3.jpg?v=202507240845 ]
■データ抽出の省力化
[表2: https://prtimes.jp/data/corp/118454/table/87_2_2b6c4055afeeb0bc6d2c9fe775af7003.jpg?v=202507240845 ]
■データ格納の省力化
[表3: https://prtimes.jp/data/corp/118454/table/87_3_3be0f37daab1c1aca2a99f01cb889746.jpg?v=202507240845 ]
[画像: https://prcdn.freetls.fastly.net/release_image/118454/87/118454-87-0d77b8538276a0aa8f75b39f9c8a1a54-1916x933.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
「AI前処理テンプレートシリーズ」のデータ加工処理イメージ
*1 RAG(Retrieval-Augmented Generation):検索拡張生成とも呼ばれ、大規模言語モデル(LLM)に新たに外部の情報を組み合わせ、生成AIの検索精度を向上させる技術
*2 当社製品の価格表PDF(HULFT10:表・テキスト混在の12ページのドキュメント)を変換対象として使用し、3種類の生成AI(Claude/Gemini/Qwen)でQA形式に変換する前処理をした場合、無処理の場合は質問に対する正解率が30~50%だったのに対し、前処理を行った場合は回答精度が80~90%まで向上(セゾンテクノロジー調べ)
*3 PDFおよび画像からのテキスト抽出を行った結果、PDFからのテキスト抽出は平均約60%、画像からのテキスト抽出は平均約50%の作業時間省力化(セゾンテクノロジー調べ)
*4 テンプレート種別「クレンジング」は生成AIを経由せず「HULFT Square」のみでデータを加工処理
セゾンテクノロジーについて
「世界中のデータをつなぎ、誰もがデータを活用できる社会を作る」をミッションに、安全・安心の基盤となるデータ連携製品や IT サービス、金融や流通業をはじめとする多種多様な業種向けのシステム開発・運用をグローバルに展開しています。長年にわたり環境の変化に即応してきた強みを活かし、現在はクラウド型データ連携プラットフォーム(iPaaS)「HULFT Square」など先進事業の拡大に注力するほか、未来を切り拓くテクノロジーの実装に向けた取り組みを強化しています。
- セゾンテクノロジー:https://www.saison-technology.com/
- HULFT製品サイト:https://www.hulft.com/
商標関連
- 「HULFT」は、セゾンテクノロジーの商標または登録商標です。
- その他の会社名、製品名、サービス名等は、各社の商標または登録商標です。
企業プレスリリース詳細へ : https://prtimes.jp/main/html/rd/p/000000087.000118454.htmlPR TIMESトップへ : https://prtimes.jp