第03课:AI自动字幕与多语言翻译

第03课:AI自动字幕与多语言翻译

告别手动打字幕,AI帮你搞定全球化

主讲:Angel Zhang & Charlie Cao


本节学习目标

  • 掌握多种AI字幕生成工具的使用方法
  • 学会AI多语言翻译和双语字幕制作
  • 理解字幕样式设计对视频质量的影响
  • 能够快速为任意视频添加高质量字幕

一、AI字幕工具对比

工具 中文识别 英文识别 翻译 价格
剪映 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ 免费
CapCut ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 免费
Whisper ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 免费开源
Descript ⭐⭐⭐ ⭐⭐⭐⭐⭐ 免费版可用

二、剪映AI字幕进阶

基础操作回顾

导入视频 → 文本 → 智能字幕 → 开始识别
→ 逐条检查修正 → 选择字幕样式 → 导出

字幕时间轴微调

  • AI识别的时间轴大多准确,但偶尔需要微调
  • 拖动字幕块的起止点调整显示时间
  • 确保字幕和语音同步,不要提前或延后

批量修改样式

  • 选中一条字幕 → 调整字体/大小/颜色/描边
  • 右键 → “应用到所有字幕”
  • 一次性统一全部字幕样式

花字技巧

在关键词处添加动态花字:

  • 数字加粗放大(如"日入3000")
  • 关键词高亮颜色
  • 强调词加动画效果

三、AI多语言翻译字幕

方案1:剪映内置翻译

智能字幕 → 翻译 → 选择目标语言 → 生成

支持中→英、英→中、日语、韩语等。

方案2:ChatGPT翻译+手动导入

  1. 导出字幕文件(SRT格式)
  2. 将SRT内容粘贴给ChatGPT
  3. Prompt:请将以下SRT字幕翻译为英文,保持时间码不变
  4. 将翻译后的SRT导入视频

方案3:双语字幕制作

Step 1:生成中文字幕
Step 2:AI翻译生成英文字幕
Step 3:中文字幕放底部,英文字幕放稍上方
Step 4:英文字体略小,颜色用白色/灰色区分

四、Whisper——开源AI语音识别

什么是Whisper

OpenAI开源的语音识别模型,识别准确率极高,支持99种语言。

在线使用方式

多个网站提供Whisper免费使用:

  • Hugging Face Spaces:搜索"whisper",上传音频即可
  • Google Colab:免费GPU运行Whisper

Whisper的优势

  • 完全免费,无次数限制
  • 支持超长音频
  • 可以选择模型大小(速度vs准确率)
  • 输出SRT/VTT字幕文件

五、字幕样式设计指南

不同平台的字幕规范

平台 字幕位置 字体大小 注意事项
抖音/TikTok 居中偏上 较大 避开底部互动区
B站 底部居中 中等 不遮挡弹幕区
YouTube 底部居中 标准 可用YouTube自动字幕
小红书 居中 较大 竖屏注意留白

字幕配色方案

场景 推荐方案
通用 白色文字+黑色描边
知识类 黄色文字+深色底框
时尚/美妆 白色无衬线字体+半透明底
搞笑/娱乐 彩色文字+夸张动画

本课作业

  1. 用剪映为一段中文视频自动生成字幕,并手动修正错误
  2. 将中文字幕翻译为英文,制作双语字幕版本
  3. 尝试3种不同的字幕样式,对比效果

下一课,我们学习AI配音与声音克隆技术。