MuleRun
Chat
Resources
Pricing
Back to all
llm-eval-designer
by
Ryoichi Izumita
Run
0
0
Feb 6, 2026
Visit Source
LLM生成システムの検証設計スキル。assay-kitフレームワークを活用し、LLM特有の失敗モード(幻覚、例への過学習、部分的処理)を考慮した総合的なテストケース設計を支援する。