视频配音 · 快速上手

视频配音快速上手

如果你要第一次跑通 NativeVid 视频配音流程,这一页会按实际操作顺序带你从素材到成片走完整套步骤。

本页摘要

  • 先确认视频、字幕和媒体文件夹,再进入角色与音色配置。
  • 重点查看审校、失败重试、合成与音画对齐等关键步骤。
  • 建议先用短视频样本试跑,熟悉流程后再批量处理。
先记住一句话: NativeVid 的视频配音流程是“资源匹配 → 翻译/术语 → 角色配置 → 角色音色 → 配音审校 → 音画对齐 / 视频合成”。 如果字幕已经是目标语言,可直接跳过翻译,流程会更短。

开始前请先准备好

  • 一个包含视频和字幕的文件夹,最好把同一批任务放在同一目录下
  • 视频与字幕文件名尽量一致,例如 episode01.mp4 对应 episode01.srt
  • 常见视频格式:.mp4.mkv.avi.mov.webm
  • 常见字幕格式:.srt.ass.vtt
推荐做法: 批量处理时,只把同一系列、同一课程或同一风格的视频放进同一个文件夹,便于角色配置和整体管理。

第一步:选择媒体文件夹并检查匹配结果

打开 NativeVid 的“视频配音”页面,点击“选择文件夹”,选中包含视频和字幕的目录。

  1. 系统自动扫描视频文件与字幕文件
  2. 按文件名进行自动匹配,已匹配项会直接显示
  3. 未匹配到字幕的视频,可在列表里手动指定对应字幕
  4. 如果检测到重复文件,系统会把重复内容移到 _duplicates 文件夹
容易卡住的点: 如果视频和字幕命名差异太大,自动匹配会失败。最稳妥的方式仍然是保持“同名不同后缀”。

任务创建后,默认输出目录会自动设为当前文件夹下的 dubbed 子目录,无需额外设置。

第二步:设置翻译与音轨选项

在提交任务前,您需要决定这次任务是否需要翻译,以及是否要保留背景音乐。

1. 选择源语言与目标语言

如果字幕是原始语言字幕,请选择正确的源语言和目标语言; 后续翻译、音色加载和输出命名都会使用这组语言信息。

2. 是否跳过翻译

如果您上传的字幕已经是目标语言,例如已经有英文字幕、现在只想生成英文配音, 可以开启“跳过翻译”,系统会直接把上传字幕作为配音文本。

流程变化: 开启“跳过翻译”后,创建任务会直接进入“角色配置”; 不跳过时,任务会先进入术语审校或翻译页面。

3. 是否开启术语审校

当视频里有人名、品牌名、专业术语时,建议开启术语审校。这样在真正开始翻译前, 可以先确认高频术语的译法,减少后面逐句返工。

4. 是否开启背景音乐分离

如果您希望在新配音之外继续保留原视频中的伴奏、鼓点或环境底音,可以开启“背景音乐分离”。 开启后至少要勾选一个需要保留的音轨,例如鼓点、低音、其他伴奏、吉他或钢琴。

怎么选更稳妥: 讲解类、课程类、访谈类内容,通常先保留“其他伴奏”或较轻的底音即可; 如果原片节奏感很强,再考虑补充鼓点或低音。第一次尝试时建议少选几条音轨,先确认人声清晰度,再逐步增加保留内容。
排错建议: 如果提交任务时无法继续,先检查是否已经至少勾选 1 条保留音轨; 如果合成后觉得背景音乐过抢、影响人声辨识,可以关闭背景音乐分离重新跑一版,或减少保留的音轨类型。

第三步:创建角色并分配字幕

任务进入“角色配置”后,先不要急着选音色,先把说话人关系理清楚。

  1. 在左侧角色库中新建角色,例如“旁白”“主持人”“嘉宾 A”
  2. 为每个角色设置颜色,方便在字幕列表里快速识别
  3. 点击字幕句子并分配角色,支持逐句点选、拖拽连续标注
  4. 常见高频角色可以用快捷键快速切换分配
  5. 对明显属于同一角色的未标注句子,可使用“分配所有未标注”批量处理
进入下一步的条件: 当前任务中的所有字幕句子都要完成角色分配,否则后续配音页很容易出现角色不全或无法继续的问题。

第四步:给每个角色选择音色并启动配音

进入“角色音色”页面后,系统只会显示已经分配过字幕的角色。

  1. 点击左侧角色,查看该角色当前目标语言下可用的音色列表
  2. 用搜索框、性别筛选、年龄筛选缩小范围
  3. 试听合适的音色,确认风格是否匹配内容
  4. 为所有角色选好音色后保存配置
  5. 点击“开始配音”,系统会按字幕行批量生成语音
如果试听失败: 这通常与当前 TTS 服务网络受限或服务不可用有关。您仍然可以直接选择音色并继续, 真正的批量配音是否成功,以审校页里的结果为准。

第五步:在配音审校页处理异常句子

进入“配音审校”后,您可以同时看到文件级进度和句子级状态。

  1. 查看每个视频文件的配音进度、完成数与失败状态
  2. 点击单句试听按钮,检查这句语音是否自然
  3. 如果某句时长不合适或表达不自然,可直接修改译文内容
  4. 点击“重新生成”仅重做这一句,无需整段重跑
  5. 如果有失败项,可使用“批量重试失败项”继续生成
建议重点检查: 开场白、专有名词、长句、情绪明显变化的句子,以及说话人切换频繁的位置。

第六步:合成视频并查看成片

当所有文件配音完成后,就可以开始“合成视频”。

  1. 在审校页点击“合成视频”
  2. 等待系统根据字幕时间轴、配音时长和保留音轨执行音画对齐
  3. 进入“视频预览”查看已合成完成的文件
  4. 在预览页切换字幕开关、调整播放速度、拖动字幕位置做检查
  5. 确认无误后,打开输出目录取走成片和字幕文件
音画对齐会做什么: NativeVid 会尽量让新配音与原有镜头节奏保持一致,必要时结合字幕时间轴和片段时长做同步处理,减少明显的声画脱节。
检查建议: 合成完成后,重点查看开场句、长句、语速变化大和说话人切换的位置;如果这些位置听感或节奏不自然,优先回到审校页调整对应句子再重新生成。

默认输出一般位于原媒体文件夹下的 dubbed 目录中,常见文件名形式为 原视频名.目标语言代码.mp4原字幕名.目标语言代码.srt

还想继续优化效果?

如果您已经跑通第一条任务,下一步建议查看常见问题,重点了解试听失败、角色缺失、重试,以及音画对齐 / 视频合成相关说明。

查看常见问题