一段口播，怎么变成一条短视频？
难点其实不在动画，而在对齐。
录屏一拖动，字幕就和声音错位了。
所以它只认一个主时钟：音频本身。
七种场景，零依赖，一个 HTML 文件。
字幕、切换、动效，全跟着音频时间走。
流程很简单：音频加字幕，生成网页。
浏览器全屏，点开始，直接录屏。
三条铁律：音频是唯一的时钟。
文字以文案为准，只输出单文件。
想换风格，只改一个预设常量。
让口播，自己长成画面。
