# dify-test-execution

> Difyフローのテスト実行・結果検証・ブラッシュアップループを行います。テスト要件書に基づいてテストを実行し、結果をMarkdownにまとめ、問題があれば修正→再テストのループを回します。「テスト実行」「テスト」「動作確認」などの依頼時に使用します。

- Author: ryuseisuda
- Repository: ryuseisuda/clawd2
- Version: 20260123002259
- Stars: 0
- Forks: 0
- Last Updated: 2026-02-06
- Source: https://github.com/ryuseisuda/clawd2
- Web: https://mule.run/skillshub/@@ryuseisuda/clawd2~dify-test-execution:20260123002259

---

---
name: dify-test-execution
description: "Difyフローのテスト実行・結果検証・ブラッシュアップループを行います。テスト要件書に基づいてテストを実行し、結果をMarkdownにまとめ、問題があれば修正→再テストのループを回します。「テスト実行」「テスト」「動作確認」などの依頼時に使用します。"
---

# Difyテスト実行 Workflow

## Instructions

1. Preflight:
   - テスト要件書（test_requirements_*.md）を読み込む
   - 存在しない場合は `dify-test-requirements` を先に実行するよう案内
   - 対象フローのapp_idを確認（flow_log/.{ファイル名}.app_id）
   - テストデータの準備状況を確認

2. テスト実行:
   - **実行方法の選択**
     - API経由: `python scripts/dify_test_runner.py -f <YML> --input key=value`
     - 手動: ユーザーにDify UI上でのテスト実行を依頼（ファイル入力等が必要な場合）
   - **テストケース順序**
     - 優先度高のテストケースから実行
     - 正常系 → 異常系 → 境界値の順
   - **結果収集**
     - 各テストケースの実行結果を記録
     - 出力値、処理時間、エラーメッセージを収集

3. 結果検証:
   - テスト要件書の成功判定基準と照合
   - 各テストケースのPass/Fail判定
   - 問題点の特定と分類:
     - **Critical**: フロー実行失敗、必須出力なし
     - **High**: 出力形式不正、期待値と大きく乖離
     - **Medium**: 軽微なフォーマット問題
     - **Low**: パフォーマンス警告

4. 結果レポート作成:
   - `./assets/test_result_template.md` をベースに作成
   - 以下を含める:
     - テスト実行サマリー（合格率、実行時間）
     - 各テストケースの詳細結果
     - 問題点一覧と原因分析
     - 修正推奨事項

5. ブラッシュアップループ:
   - **問題あり（Critical/High）の場合**:
     - 問題点を分析し修正方針を決定
     - `dify-flow-brushup-customize` でフローを修正
     - `dify-validation` で検証
     - `dify-auto-import` で再インポート
     - テスト再実行（最大3ループ）
   - **問題なし/軽微の場合**:
     - テスト完了としてレポートを確定
     - 必要に応じて `pattern-creation` でテンプレート化

6. 保存:
   - テスト結果を `flow_log/test_result_{フロー名}_{日時}.md` に保存

recommended_subagents:
  - qa-skill-qc: 共通QC。対象Skillの ./evaluation/evaluation_criteria.md を先にReadしてからQCを開始

## Resources

- assets: ./assets/test_result_template.md
- evaluation: ./evaluation/test_execution_criteria.md
- triggers: ./triggers/next_action_triggers.md
- scripts:
  - scripts/dify_test_runner.py

## Next Action
- triggers: ./triggers/next_action_triggers.md

起動条件に従い、条件を満たすSkillを自動実行する。

## Error Handling

- api_execution_failed: 認証状態を確認、Cookieを再取得
- timeout: タイムアウト時間を延長して再実行
- file_input_required: ユーザーにDify UI上での手動テストを依頼
- max_loop_exceeded: 3回のブラッシュアップ後も問題が解決しない場合、根本的な設計見直しを推奨

## テスト実行コマンド

```bash
# 基本テスト実行
source .venv/bin/activate && python scripts/dify_test_runner.py -f <YMLパス>

# 入力パラメータ指定
source .venv/bin/activate && python scripts/dify_test_runner.py -f <YMLパス> --input message=hello --input count=5

# App ID直接指定
source .venv/bin/activate && python scripts/dify_test_runner.py --app-id <APP_ID>

# エラーログ蓄積なし
source .venv/bin/activate && python scripts/dify_test_runner.py -f <YMLパス> --no-knowledge
```

## ブラッシュアップループ図

```
テスト実行
    ↓
結果検証 ─── Pass ──→ 完了
    │
   Fail
    ↓
問題分析
    ↓
dify-flow-brushup-customize
    ↓
dify-validation
    ↓
dify-auto-import
    ↓
テスト再実行（最大3回）
```