■発表論文の概要
●論文タイトル
Finetuning LLMs for Automatic Form Interaction on Web-Browser in Selenium Testing Framework
●著者
北陸先端科学技術大学院大学 グエン・ミン研究室 アミフィアブルAI研究部
Nguyen-Khang Le、 Hiep Nguyen、Ngoc-Minh Nguyen、 Son T. Luu、 Trung Vo、 Quan Minh Bui、 野村尚新、 Le-Minh Nguyen
●発表媒体
KSE2025( https://kse2025.kse-conferences.org/ )
2025年11月6日~11月8日にベトナムで開催された知識工学とシステム工学分野の最新研究に関する国際会議
●論文リンク
https://arxiv.org/abs/2511.15168
■研究の背景と目的
現代のWebアプリ開発では、SeleniumをはじめとするWebブラウザ自動操作フレームワークが、テストの自動化に必要不可欠となっています。
近年、大規模言語モデル(LLM)はコードの生成能力が非常に高く、前述の課題解決策として期待されています。しかしながら実際のWebフォームに対して、「構文的に正しいものである」「実行可能である」「入力フィールドの意図に適合したものである」といった数々の条件を満たすSeleniumスクリプトを自動生成することは容易ではありません。加えて、Webブラウザ自動操作に特化したオープンなデータセットやベンチマークは存在していないというのが現状です。
本研究は、このギャップを埋めるため、大規模言語モデル(LLM)が高品質なWebブラウザ自動操作用のSeleniumテストケースを自動生成できるよう訓練する、新しい手法の構築を目的としています。特に、構文の正確さ・実行可能性・入力フィールドのカバレッジという3つの基準を満たすデータセットと学習パイプラインの確立を目指しました。
画像1: https://www.atpress.ne.jp/releases/569683/LL_img_569683_1.png
トレーニングデータ生成手順
■本研究のポイント
本研究は、大規模言語モデル(LLM)を用いたWebブラウザ自動操作に対し、既存にない体系的なアプローチを提示し、既存の指標評価を大幅に上回る性能を示しています。
1. 初のWebブラウザ自動操作テスト専用データセットを構築
多様な実世界のウェブフォームを対象に、人手でアノテーションした例とLLM生成例を組み合わせ、かつフォームに特化した、初の「Webブラウザ自動操作テスト用専用データセット」を公開しました。
2. 実行可能性を重視したデータ生成パイプライン
GPT-4oを中心に、複数の生成パイプラインを設計しました。生成した複数のSeleniumコードを実際に実行し、失敗したスクリプトはすべて削除することで、最終データには「構文的に正しい」「実行可能である」「入力フィールドの意図に適合している」といった有効なサンプルのみを残す仕組みとなっています。
3. 既存の指標評価を大幅に上回る性能
Qwen2.5、Qwen3、およびLlama3.1といった最先端のOSS-LLMに対して、独自に作成した訓練用フォームの合成HTMLでファインチューニングを施しました。実在するフォーム画面および合成フォーム画面の両方における性能比較の結果、本手法によりチューニングしたLLMは、GPT-4oを含む強力な商用LLMと比べ、すべての評価指標(構文の正確さ、実行可能性、入力フィールドカバレッジ)で従来よりも10%ほど向上するという明確に優れた性能を示しました。
■今後の展望
本研究で構築したベンチマーク、データセット、そして方法論は、「フォーム中心のWeb自動化」に取り組む基盤として機能します。これらは今後、大規模言語モデル(LLM)ベースのWebブラウザ操作自動化の応用研究を促進し、ソフトウェアテストが完全自動化する基礎となることが期待されます。
■著者について
野村尚新
ヨーク大学哲学部卒業後、東北大学大学院にて修士課程修了。北陸先端科学技術大学院大学博士課程修了後、国立情報学研究所の特任研究員として論理学や自然言語処理をはじめとする様々な研究に携わる。2021年よりアミフィアブルに入社、産学連携とAI研究部のリードとして日々研究開発に打ち込んでいる。
Quan Minh Bui
北陸先端科学技術大学院大学博士課程修了。在学中より国立情報学研究所アシスタントを務め、某大企業との共同研究プロジェクトに携わりAIの知見を深める。2023年アミフィアブルに入社し、AI研究部の中核メンバーとして野村と共に活躍中。
■アミフィアブル株式会社について
アミフィアブルは「差別化されたAIテクノロジーから世界に新しい価値を提供する」をミッションとし、AI搭載テスト工程自動化プラットフォーム「Esplat」の開発及び運用を手掛けています。
労働集約性の高いソフトウェア開発のテスト工程をAIテクノロジーで自動化し、2021年6月に特許を取得(特許第6902814号)した自社開発の「Esplat」を武器に、多くの企業でソフトウェア開発の効率化及び品質向上に寄与しています。
また、「Esplat」導入によるソフトウェア品質の向上・テスト工数の削減だけでなく、QA(品質保証)チームの立ち上げ、テスト推進のPMO、設計書や各種業務の標準化支援等、総合的な品質管理コンサルティングを提供しています。
会社名: アミフィアブル株式会社
代表者: 代表取締役 河村 隆一
事業 : AI搭載テスト工程自動化プラットフォーム「Esplat」の開発及び運用
URL : https://www.amifiable.co.jp/
TEL : 03-6420-0391