# video-script-architect

> 精准后期合成 Skill。支持长文本分句 TTS 合成、多行文本水平/垂直双中心对齐、多视频素材自动循环拼接。

- Author: songchunyu
- Repository: arvrschool/VisionFlow
- Version: 20260207193005
- Stars: 1
- Forks: 0
- Last Updated: 2026-02-07
- Source: https://github.com/arvrschool/VisionFlow
- Web: https://mule.run/skillshub/@@arvrschool/VisionFlow~video-script-architect:20260207193005

---

---
name: video-script-architect
description: 精准后期合成 Skill。支持长文本分句 TTS 合成、多行文本水平/垂直双中心对齐、多视频素材自动循环拼接。
---

# Video Script Architect Skill

## 概述
这是视频号生产线的“总装车间”。它能处理复杂的排版需求，并解决长文本 TTS 被截断的物理难题。

## 参数
- `json_path` (必填): 结构化素材路径（含 `voiceover_script_chinese`, `video_title`, `video_key_info`）。
- `video_input` (必填): 原始视频路径或包含多个 MP4 的文件夹。

## 核心工作流

### 1. 分句 TTS 合成 (Segmented Synthesis)
- 自动按标点符号将长文案拆分为短句。
- 逐句调用 Qwen-TTS 推理，彻底解决长文本末尾“吃字”问题。
- 合并分片音频并追加 1.5 秒静音缓冲。

### 2. 视频流标准化 (Video Looping & Scaling)
- 自动计算配音总时长。
- 若视频素材不足，自动按列表循环拼接。
- 强制所有素材统一为 1080x1440 (3:4)，统一帧率 25fps，统一像素比。

### 3. 精准视觉排版 (Precision Layout)
- **逐行渲染**：每一行文字独立水平居中 (`x=(w-tw)/2`)。
- **垂直对齐**：自动计算文字块总高度，确保其在顶部/底部黑色区域内物理居中。
- **样式规范**：统一草绿色配色 (`#99CC33`)，带黑边立体效果。

## 运行示例
```bash
conda run -n dap python scripts/render_video.py "assets.json" "videos_dir/"
```