導入事例

三菱総研×TDSE「PC操作エージェント」検証レポート — 日本語ビジネス環境での実力と適用領域

2026.02.24 公開 4分で読める

この記事の結論

三菱総合研究所とTDSEが日本語ビジネス環境でのPC操作エージェント技術を検証。ChatGPT AgentとAgentS 3の比較、実務適用の可能性、日本企業が検討すべき適用領域を解説。

PC操作エージェントとは、AIが人間の指示を受けてマウスやキーボード操作を自律的に実行する技術です。2026年2月、三菱総合研究所（MRI）とTDSE株式会社が日本語ビジネス環境でのPC操作エージェント技術の有効性を検証し、「利用用途や対象システムによっては実務適用の検討が可能な水準に達している」と発表しました。この記事では、検証内容と結果、実務適用の可能性、そして日本企業がこの技術をどう活用すべきかを解説します。

PC操作エージェントとは？ — RPA進化の先にあるもの

PC操作エージェントは、従来のRPA（Robotic Process Automation）を大きく超える技術です。RPAは「事前にプログラムされた手順通りにPC操作を繰り返す」技術ですが、PC操作エージェントは「画面を見て理解し、自律的に操作手順を判断して実行する」技術です。

比較軸	従来のRPA	PC操作エージェント
操作方法	事前にプログラムされたルールに従う	画面を認識し、自律的に判断して操作
画面変更への対応	レイアウト変更で動作不能になることが多い	画面を視覚的に認識するため柔軟に対応
設定コスト	ワークフローの設計・テストが必要	自然言語で指示するだけで動作
適用範囲	定型的・反復的なタスク	定型タスク＋一定の判断が必要なタスク

つまり、「画面のボタン配置が変わったらRPAが止まる」という問題を根本から解決し、「自然言語で指示するだけでPCを操作してくれるAI」を実現する技術です。

三菱総研×TDSEの検証概要

検証対象

カテゴリ	ツール	バージョン時期
商用ソフトウェア	ChatGPT Agent（OpenAI）	2025年12月時点
オープンソース	AgentS 3	2025年12月時点

検証環境

ビジネスの場で頻出する以下の業務を想定した検証データと検証環境が構築されました。

対象業務: システム設定作業、事務手続き（各種申請フォーム入力、データ集計など）

評価方法: タスク完了率と事前設定した評価基準に基づき、100点満点で評価

検証結果のポイント

1. 日本語ビジネス環境での有効性を確認
画面やボタン名から機能が読み取れ、具体的な指示が可能な場合、AIは正しい操作を実行できることが確認されました。

2. 実務適用が検討可能な水準に到達
「利用用途や対象システムの画面構成によっては実務適用の検討が可能な水準に達している」と評価されています。ただし、全ての業務で実用レベルとは言い切れず、適用領域の選定が重要です。

3. 特別な設定なしで業務自動化が可能
RPAのような事前のワークフロー設計が不要で、自然言語の指示だけで動作する点が大きな利点です。

4. 機密情報への適用可能性
オープンソースのAgentS 3を使えば、データを外部に送信せずにローカル環境で処理できるため、機密性の高い業務への適用も視野に入ります。

商用版 vs オープンソース — ChatGPT Agent vs AgentS 3

今回の検証で注目すべきは、商用のChatGPT Agentだけでなく、オープンソースのAgentS 3も検証対象に含まれている点です。

比較軸	ChatGPT Agent	AgentS 3
提供元	OpenAI（商用）	OSS
コスト	API利用料が発生	無料（自前インフラ必要）
データ送信	OpenAIのサーバーに送信	ローカル処理可能
精度	高い（大規模言語モデルの恩恵）	業務フローによっては一定能力
適合企業	データ機密性が低い業務、速度重視	機密性が高い業務、コスト重視

日本企業、特に金融・医療・公共セクターでは、データを外部に送信できないケースが多くあります。AgentS 3のようなオープンソースの選択肢があることは、PC操作エージェントの適用範囲を大幅に広げます。

PC操作エージェントの実用化に向けた課題

1. UIの複雑さへの対応

画面やボタン名から機能が「読み取れない」UIの場合、AIの操作精度は低下します。アイコンのみで表示されるボタン、日本語と英語が混在するUI、独自の略語が使われたシステムなどは、現時点では苦手な領域です。

2. エラーハンドリング

操作中にエラーダイアログが表示された場合、AIが適切に対処できるかどうかは検証の余地があります。想定外の画面遷移やポップアップへの対応力は、まだ人間の判断に依存する部分が大きいです。

3. 操作速度

PC操作エージェントは画面をキャプチャしてAIモデルに送信し、次のアクションを判断するプロセスを繰り返します。各操作に数秒かかるため、人間の熟練者と比較すると処理速度は遅い傾向があります。「速さ」ではなく「自動化」と「24時間稼働」にメリットがあります。

日本企業が検討すべき適用領域

今回の検証結果を踏まえ、PC操作エージェントの導入効果が高いと考えられる領域は以下の通りです。

業務領域	具体的なタスク例	適合度
システム管理	ユーザーアカウント作成、権限設定、パスワードリセット	高
経理・事務	請求書入力、経費精算、各種申請フォームの処理	高
データ入力	レガシーシステムへのデータ転記、CSV取り込み	高
テスト	WebアプリケーションのUIテスト自動化	中
カスタマーサポート	社内システムでの情報検索・回答作成	中

共通点は「画面のUIが明確で、操作手順が言語化しやすい業務」です。逆に、高度な判断が必要な業務や、画面遷移が複雑なレガシーシステムの操作は、現時点では適用ハードルが高いと考えられます。

まとめ

三菱総研とTDSEの検証により、PC操作エージェント技術は日本語ビジネス環境でも実務適用の検討が可能な水準に達していることが確認されました。従来のRPAが抱えていた「画面変更への脆弱性」「設定コストの高さ」を解決する可能性があります。

ただし、万能ではありません。UIが明確で指示が具体化できる業務からスタートし、段階的に適用範囲を広げるアプローチが推奨されます。機密データを扱う業務では、オープンソースのAgentS 3によるローカル処理も選択肢に入ります。

PC操作エージェントは、AIエージェントの「最もわかりやすい応用例」です。自社の業務プロセスの中で「定型的だが手作業に頼っている」領域を洗い出し、小規模な検証から始めてみてください。

※ 本記事の情報は2026年2月時点のものです。サービスの料金・仕様は変更される可能性があります。最新情報は各サービスの公式サイトをご確認ください。