# fixing-transcriptions > とまだの文字起こし・音声入力(Whisper等)の誤変換・誤字脱字を自動修正するスキル。AI駆動開発、Claude Code、MCP、プログラミング用語の誤変換を専門的に修正。「文字起こしを修正」「誤変換を直して」「誤字脱字を修正」「音声入力を整理」「テキストをクリーンアップ」「変換ミスを直して」と言われたときに使用。Obsidianノートの文字起こし整理、技術用語の表記統一に最適。Use PROACTIVELY when fixing transcriptions, correcting voice input errors, or cleaning up Whisper output. - Author: tomada - Repository: tomada1114/tomada-claude-plugins - Version: 20260119173238 - Stars: 2 - Forks: 0 - Last Updated: 2026-02-06 - Source: https://github.com/tomada1114/tomada-claude-plugins - Web: https://mule.run/skillshub/@@tomada1114/tomada-claude-plugins~fixing-transcriptions:20260119173238 --- --- name: fixing-transcriptions description: とまだの文字起こし・音声入力(Whisper等)の誤変換・誤字脱字を自動修正するスキル。AI駆動開発、Claude Code、MCP、プログラミング用語の誤変換を専門的に修正。「文字起こしを修正」「誤変換を直して」「誤字脱字を修正」「音声入力を整理」「テキストをクリーンアップ」「変換ミスを直して」と言われたときに使用。Obsidianノートの文字起こし整理、技術用語の表記統一に最適。Use PROACTIVELY when fixing transcriptions, correcting voice input errors, or cleaning up Whisper output. --- # Transcription Fixer(文字起こし修正スキル) 音声入力(Whisper等)で生成されたテキストの誤変換を**2段階方式**で自動修正するスキルです。 ## 概要 **Phase 1(機械的置換)** + **Phase 2(LLM判断)** の2段階で処理します。 ``` Phase 1: Python スクリプトで辞書ベースの確実な置換(高速・コストゼロ) ↓ Phase 2: LLM で文脈依存の微妙な判断(高品質) ``` ## 処理フロー ### Phase 1: 機械的置換 Pythonスクリプトで辞書ベースの置換を実行: ```bash python3 ~/.claude/skills/fixing-transcriptions/scripts/fix_transcription.py ``` **オプション**: - `--dry-run`: 変更を適用せずプレビュー - `--json`: JSON形式で出力(LLM連携用) **出力例**: ``` Phase 1: 機械的置換 完了 処理ファイル数: 30件 修正あり: 22件 総修正件数: 150件 修正内容: - file1.txt: 5件 (クロードコード→Claude Code, cloud.md→CLAUDE.md) - file2.txt: 3件 (アンソロピック→Anthropic, フックス→Hooks) ``` ### Phase 2: LLM判断 Phase 1で処理できない文脈依存のパターンをLLMで判断: - 「クラウド」→ Claude or クラウド? - 「カーソル」→ Cursor or カーソル? - 「ノート」→ note or ノート? ## 辞書ファイル `~/.claude/skills/fixing-transcriptions/dictionaries/misconversion-dict.json` ### 構造 ```json { "exact_match": { "ai_services": { "クロードコード": "Claude Code", ... }, "claude_code_files": { "cloud.md": "CLAUDE.md", ... }, "claude_code_features": { "フックス": "Hooks", ... }, ... }, "regex_patterns": [ { "pattern": "...", "replacement": "..." } ], "context_dependent": [ { "pattern": "クラウド", "candidates": ["Claude", "クラウド"], "hint": "..." } ] } ``` ### カテゴリ | カテゴリ | 内容 | |----------|------| | `ai_services` | Claude Code, Anthropic, ChatGPT等 | | `claude_code_files` | CLAUDE.md, settings.json, .claude/rules/ | | `claude_code_features` | Hooks, Skills, サブエージェント等 | | `claude_code_commands` | /init, /clear, /compact等 | | `claude_code_tools` | Read, Write, Edit, Bash等 | | `mcp_related` | MCP, Playwright MCP, Context7等 | | `programming_languages` | TypeScript, Python, Node.js等 | | `dev_tools` | npm, Git, Prettier, VS Code等 | | `common_errors` | 過読性→可読性, エラー形→エラー系等 | ## 使い方 ### コマンドから(推奨) ``` /fix-transcriptions /path/to/file.txt /fix-transcriptions /path/to/directory/ ``` ### 直接スキルを使う ``` このテキストの誤変換を修正してください: [テキストを貼り付け] ``` ## 文脈依存パターン 以下のパターンはLLM(Phase 2)で判断: | パターン | AI文脈 | 一般文脈 | |----------|--------|----------| | クラウド | Claude | クラウド(雲/サービス) | | カーソル | Cursor | カーソル(矢印) | | ノート | note(プラットフォーム) | ノート(メモ) | | 俳句 | Haiku(モデル) | 俳句(詩) | | ソネット | Sonnet(モデル) | ソネット(詩) | | 禅/ゼン | Zenn(ブログ) | 禅(仏教) | ## 辞書への追加 新しいパターンを追加する場合: 1. JSON辞書を編集: `~/.claude/skills/fixing-transcriptions/dictionaries/misconversion-dict.json` 2. 適切なカテゴリに追加 3. `context_dependent` は文脈判断が必要なもののみ ## スキルの役割分担 ### fixing-transcriptions(このスキル) - **対象**: 全ての文字起こしテキスト - **役割**: Phase 1 + Phase 2 で誤変換修正 ### fixing-srt-subtitles - **対象**: SRT字幕ファイル専用 - **役割**: SRTフォーマット固有の処理 + このスキルの辞書を使用 ## 関連ファイル ``` ~/.claude/skills/fixing-transcriptions/ ├── SKILL.md # このファイル ├── dictionaries/ │ └── misconversion-dict.json # 誤変換辞書(300+パターン) └── scripts/ └── fix_transcription.py # Phase 1 スクリプト ``` ## 更新履歴 - **2025-01-16**: Phase 1(機械的置換)+ Phase 2(LLM判断)の2段階方式に改善 - Pythonスクリプトによる高速な機械的置換を追加 - JSON辞書形式に移行(misconversion-note.md → misconversion-dict.json) - 300+パターンをカテゴリ別に整理