# dify-test-execution > Difyフローのテスト実行・結果検証・ブラッシュアップループを行います。テスト要件書に基づいてテストを実行し、結果をMarkdownにまとめ、問題があれば修正→再テストのループを回します。「テスト実行」「テスト」「動作確認」などの依頼時に使用します。 - Author: ryuseisuda - Repository: ryuseisuda/clawd2 - Version: 20260123002259 - Stars: 0 - Forks: 0 - Last Updated: 2026-02-06 - Source: https://github.com/ryuseisuda/clawd2 - Web: https://mule.run/skillshub/@@ryuseisuda/clawd2~dify-test-execution:20260123002259 --- --- name: dify-test-execution description: "Difyフローのテスト実行・結果検証・ブラッシュアップループを行います。テスト要件書に基づいてテストを実行し、結果をMarkdownにまとめ、問題があれば修正→再テストのループを回します。「テスト実行」「テスト」「動作確認」などの依頼時に使用します。" --- # Difyテスト実行 Workflow ## Instructions 1. Preflight: - テスト要件書(test_requirements_*.md)を読み込む - 存在しない場合は `dify-test-requirements` を先に実行するよう案内 - 対象フローのapp_idを確認(flow_log/.{ファイル名}.app_id) - テストデータの準備状況を確認 2. テスト実行: - **実行方法の選択** - API経由: `python scripts/dify_test_runner.py -f --input key=value` - 手動: ユーザーにDify UI上でのテスト実行を依頼(ファイル入力等が必要な場合) - **テストケース順序** - 優先度高のテストケースから実行 - 正常系 → 異常系 → 境界値の順 - **結果収集** - 各テストケースの実行結果を記録 - 出力値、処理時間、エラーメッセージを収集 3. 結果検証: - テスト要件書の成功判定基準と照合 - 各テストケースのPass/Fail判定 - 問題点の特定と分類: - **Critical**: フロー実行失敗、必須出力なし - **High**: 出力形式不正、期待値と大きく乖離 - **Medium**: 軽微なフォーマット問題 - **Low**: パフォーマンス警告 4. 結果レポート作成: - `./assets/test_result_template.md` をベースに作成 - 以下を含める: - テスト実行サマリー(合格率、実行時間) - 各テストケースの詳細結果 - 問題点一覧と原因分析 - 修正推奨事項 5. ブラッシュアップループ: - **問題あり(Critical/High)の場合**: - 問題点を分析し修正方針を決定 - `dify-flow-brushup-customize` でフローを修正 - `dify-validation` で検証 - `dify-auto-import` で再インポート - テスト再実行(最大3ループ) - **問題なし/軽微の場合**: - テスト完了としてレポートを確定 - 必要に応じて `pattern-creation` でテンプレート化 6. 保存: - テスト結果を `flow_log/test_result_{フロー名}_{日時}.md` に保存 recommended_subagents: - qa-skill-qc: 共通QC。対象Skillの ./evaluation/evaluation_criteria.md を先にReadしてからQCを開始 ## Resources - assets: ./assets/test_result_template.md - evaluation: ./evaluation/test_execution_criteria.md - triggers: ./triggers/next_action_triggers.md - scripts: - scripts/dify_test_runner.py ## Next Action - triggers: ./triggers/next_action_triggers.md 起動条件に従い、条件を満たすSkillを自動実行する。 ## Error Handling - api_execution_failed: 認証状態を確認、Cookieを再取得 - timeout: タイムアウト時間を延長して再実行 - file_input_required: ユーザーにDify UI上での手動テストを依頼 - max_loop_exceeded: 3回のブラッシュアップ後も問題が解決しない場合、根本的な設計見直しを推奨 ## テスト実行コマンド ```bash # 基本テスト実行 source .venv/bin/activate && python scripts/dify_test_runner.py -f # 入力パラメータ指定 source .venv/bin/activate && python scripts/dify_test_runner.py -f --input message=hello --input count=5 # App ID直接指定 source .venv/bin/activate && python scripts/dify_test_runner.py --app-id # エラーログ蓄積なし source .venv/bin/activate && python scripts/dify_test_runner.py -f --no-knowledge ``` ## ブラッシュアップループ図 ``` テスト実行 ↓ 結果検証 ─── Pass ──→ 完了 │ Fail ↓ 問題分析 ↓ dify-flow-brushup-customize ↓ dify-validation ↓ dify-auto-import ↓ テスト再実行(最大3回) ```