# calibrating-transcribed-subtitles

> 校准和修正 AI 自动转录生成的字幕文本，包括专业术语校正、断句优化、格式统一和口语化内容润色。当用户提供 SRT/VTT 字幕文件、转录文本，或要求修正字幕错误、优化字幕可读性、统一术语表达时使用。

- Author: Kratos
- Repository: leochanai/leo-obsidian-main
- Version: 20260122172202
- Stars: 1
- Forks: 0
- Last Updated: 2026-02-06
- Source: https://github.com/leochanai/leo-obsidian-main
- Web: https://mule.run/skillshub/@@leochanai/leo-obsidian-main~calibrating-transcribed-subtitles:20260122172202

---

---
name: calibrating-transcribed-subtitles
description: 校准和修正 AI 自动转录生成的字幕文本，包括专业术语校正、断句优化、格式统一和口语化内容润色。当用户提供 SRT/VTT 字幕文件、转录文本，或要求修正字幕错误、优化字幕可读性、统一术语表达时使用。
---

# 转录字幕校准

## 快速开始

1. 加载用户提供的字幕文件或转录文本
2. 参考 [GLOSSARY.md](GLOSSARY.md) 中的术语表进行校准
3. 按工作流完成校准和输出

## 工作流

```
字幕校准进度：
- [ ] 步骤 1：加载并分析字幕内容
- [ ] 步骤 2：术语校正（参考术语表）
- [ ] 步骤 3：断句和格式优化
- [ ] 步骤 4：口语化内容润色
- [ ] 步骤 5：输出校准后的字幕
```

### 步骤 1：加载并分析字幕内容

**支持的格式**：
- `.srt`：标准字幕格式（带时间戳和序号）
- `.vtt`：WebVTT 格式
- 纯文本：转录文本（无时间戳）

**分析要点**：
- 识别领域（技术、学术、商业等）
- 检测主要语言和混用情况
- 评估转录质量和常见错误类型

### 步骤 2：术语校正

参考 [GLOSSARY.md](GLOSSARY.md) 进行术语校正。

**校正优先级**：
1. **专有名词**：人名、公司名、产品名
2. **技术术语**：行业专业词汇
3. **同音异义词**：依赖上下文判断
4. **缩写和首字母词**：确保一致性

**常见 AI 转录错误模式**：

| 错误类型 | 示例 | 校正 |
|----------|------|------|
| 同音错误 | "他的" → "它的" | 根据上下文 |
| 专业术语 | "A派" → "API" | 技术领域 |
| 连读误识 | "这个的" → "这个" | 删除冗余 |
| 数字混淆 | "一百万" vs "1000000" | 统一格式 |

### 步骤 3：断句和格式优化

**断句原则**：
- 每行不超过 40 个中文字符或 80 个英文字符
- 在自然停顿处断句（逗号、句号、语气停顿）
- 保持语义完整，避免中途断句
- 时间戳精度保持在 0.1 秒以内

**格式规范**：

```srt
1
00:00:01,000 --> 00:00:04,500
大家好，今天我们来聊一下
人工智能的最新发展趋势

2
00:00:04,500 --> 00:00:08,200
首先，让我们看一下
大语言模型领域的进展
```

### 步骤 4：口语化内容润色

**处理原则**：
- 删除过多的语气词（"呃"、"那个"、"就是说"）
- 保留必要的语气词以保持自然感
- 修正语法错误，但保持口语风格
- 避免过度书面化

**示例**：

| 原始转录 | 校准后 |
|----------|--------|
| 呃...就是说...这个技术它其实是... | 这个技术其实是... |
| 然后的话呢我们可以看到说这个... | 我们可以看到这个... |
| 对对对没错没错 | 没错 |

### 步骤 5：输出校准后的字幕

**输出格式**：保持与输入相同的格式（SRT/VTT/纯文本）

**质量检查清单**：
- [ ] 术语表中的词汇已统一校正
- [ ] 断句自然，每行长度适中
- [ ] 时间戳与语音同步
- [ ] 口语化内容已适当润色
- [ ] 格式符合规范

## 术语表使用

术语表存放在 [GLOSSARY.md](GLOSSARY.md) 中，包含：
- 常见 AI/技术术语
- 人名/公司名/产品名
- 行业专用缩写

**使用方式**：
1. 首先检查术语表中是否有相关条目
2. 按照术语表中的标准写法进行替换
3. 如发现新的高频术语，建议添加到术语表

## 输出模板

### SRT 格式

```srt
1
00:00:00,000 --> 00:00:03,500
[校准后的第一句]

2
00:00:03,500 --> 00:00:07,000
[校准后的第二句]
```

### 校准报告（可选）

```markdown
## 校准报告

**原始文件**：[文件名]
**总时长**：[时长]
**修改统计**：
- 术语校正：[N] 处
- 断句调整：[N] 处
- 口语润色：[N] 处

**主要修改**：
1. [修改说明 1]
2. [修改说明 2]
```

## 特殊情况处理

| 情况 | 处理方式 |
|------|----------|
| **术语表无对应条目** | 保持原样，必要时标注 [?] |
| **模糊不清的语音** | 保留原转录，添加 [inaudible] 标记 |
| **多语言混用** | 分别处理，保持语言一致性 |
| **背景音乐/杂音** | 添加 [♪ 音乐 ♪] 或 [背景杂音] 标记 |