AI智能双语字幕生成软件完全指南
软件介绍AutoAddSubtitle 是一款自动为视频添加双语字幕的软件。它可以自动识别视频中的语音内容,生成原文字幕,并将其翻译成您选择的语言,最终生成带有双语字幕的视频文件。
主要功能
自动识别视频中的语音并生成字幕
支持多种语言之间的翻译
可自定义字幕样式和位置
支持单个视频处理和批量处理
同时导出SRT格式的字幕文件
系统需求
操作系统: Windows 10/11
硬盘空间: 至少 2GB 可用空间(用于存储模型文件和临时文件)
系统组件依赖 运行程序前确保安装了 Visual C++ Redistributable
系统组件依赖 FFmpeg(如果使用视频处理功能)检查 FFmpeg 是否在系统 PATH 中
内存(RAM): 最低 4GB,推荐 8GB 或更高
网络连接: 首次使用时需要网络连接下载必要的语音识别和翻译模型
重要提示:语音模型和翻译模型,模型越大识别和翻译的质量就越高,对机器的性能要求就越高
安装指南软件主界面介绍
软件界面主要分为四个部分:
视频选择区域:支持单个视频处理和批量处理模式
字幕设置区域:包含语言检测、样式选项和显示设置
模型设置区域:可选择语音识别模型和翻译模型
处理状态区域:显示当前处理进度和状态
下载和安装夸克网盘下载我用夸克网盘分享了「AI智能双语字幕软件」,点击链接即可保存。打开「夸克APP」,无需下载在线播放视频,畅享原画5倍速,支持电视投屏。链接:https://pan.quark.cn/s/7cf546b6e294
百度网盘下载通过网盘分享的文件:智能双语字幕生成器 (百度网盘上传会损害模型文件,需要模型文件请用 夸克网盘下载或则自行配置代理下载)链接: https://pan.baidu.com/s/1rU8Jh6qvMk72VMerfBXSFQ?pwd=iykq 提取码: iykq
启动前准备windows电脑
设置电脑环境环境的代理如下步骤
检查系统变量设置(图形界面)
打开控制面板 → 系统与安全 → 系统 → 高级系统设置
点击“环境变量”按钮
查看用户变量或系统变量中是否有 HTTP_PROXY / HTTPS_PROXY 项目
代理地址的端口需要根据自己的vpn 服务商来设置-127.0.0.1:XXXX 即这个xxxx 端口号在自己的代理软件查找,不同的代理软件可能不一样-127.0.0.1:XXXX 即这个xxxx 端口号在自己的代理软件查找,不同的代理软件可能不一样-127.0.0.1:XXXX 即这个xxxx 端口号在自己的代理软件查找,不同的代理软件可能不一样
以下是博主电脑的配置示例,需要修改成你自己的本地代理配置!
macos 电脑(TBD)首次启动
首次启动后,软件会手动下载必要的模型文件。这可能需要一些时间,取决于您的网络速度(需要科学上网)
首次启动需要输入激活码进行激活(如果您已购买授权)
获取密钥:
将机器码发送给销售人员
或邮箱联系:hans.zheng1012@outlook.com
或小红书账号:487724211
微信账号:
完成激活:输入激活密钥并点击”激活”按钮
使用步骤单个视频处理
启动 AutoAddSubtitle 软件
点击界面上的”选择视频”按钮
在弹出的文件浏览器中选择您要添加字幕的视频文件
设置字幕选项(详见下方”字幕设置”)
点击”开始处理”按钮
等待处理完成,处理时间取决于视频长度和您的电脑性能
处理完成后,软件会显示输出文件的位置
批量处理视频
启动 AutoAddSubtitle 软件
点击界面上的”选择文件夹”按钮
在弹出的文件夹浏览器中选择包含多个视频文件的文件夹
设置字幕选项(详见下方”字幕设置”)
点击”开始批量处理”按钮
等待所有视频处理完成
处理完成后,软件会显示输出文件夹的位置
字幕设置基本设置
输出路径: 选择生成的视频和字幕文件的保存位置
显示原文字幕: 是否在视频中显示原始语言字幕
显示翻译字幕: 是否在视频中显示翻译后的字幕
目标语言: 选择翻译的目标语言(中文、英语、法语、德语等)
高级设置
Whisper 模型: 选择语音识别模型大小(base、small、medium、large),越大的模型识别准确率越高,但处理速度更慢
翻译模型: 选择用于翻译的模型(NLLB 600M、1.3B、3.3B),越大的模型翻译质量越好,但处理速度更慢
原文字幕位置: 调整原文字幕在视频中的垂直位置(0.0-1.0)
翻译字幕位置: 调整翻译字幕在视频中的垂直位置(0.0-1.0)
原文字体大小: 设置原文字幕的字体大小
翻译字体大小: 设置翻译字幕的字体大小
原文字幕颜色: 设置原文字幕的颜色
翻译字幕颜色: 设置翻译字幕的颜色
输出文件说明每次处理完成后,软件会在指定的输出目录中创建以时间戳命名的文件夹,包含以下文件:
原视频名称_with_subtitles.mp4: 带有双语字幕的视频文件
原视频名称.srt: 原文字幕文件
原视频名称_bilingual.srt: 双语字幕文件(可用于其他视频播放器)
常见问题及解决方法启动问题问题: 软件无法启动或启动后立即崩溃解决方法:
确保您的计算机满足最低系统要求
以管理员身份运行软件
重新安装软件
检查杀毒软件是否阻止了程序运行
视频处理问题问题: 视频处理过程中出现错误解决方法:
确保视频文件格式受支持(MP4, AVI, MOV, MKV, FLV, WMV)
检查视频文件是否完整且可播放
确保硬盘有足够的空间存储处理结果
尝试使用较小的模型选项
问题: 生成的视频没有声音解决方法:
检查原视频是否有声音
确认是否使用了最新版本的软件(已修复此问题)
尝试将视频另存为不同格式后再处理
字幕质量问题问题: 语音识别不准确解决方法:
尝试使用更大的Whisper模型(如medium或large)
确保视频音频质量良好
如果视频中有背景噪音,可能会影响识别准确率
问题: 翻译质量不理想解决方法:
尝试使用更大的翻译模型(NLLB 1.3B或3.3B)
特定领域或专业术语的翻译可能不够准确,这是当前AI翻译的普遍限制
网络和模型问题问题: 无法下载模型解决方法:
检查网络连接
如果您在中国大陆,可能需要VPN以下载某些模型
尝试重启软件,重新触发下载
问题: 模型加载失败解决方法:
确保有足够的磁盘空间
重新启动软件
在设置中选择较小的模型尝试
输出和存储问题问题: 找不到处理后的文件解决方法:
检查处理完成后软件显示的输出路径
默认情况下,文件将保存在以下位置之一:
您指定的输出路径
~/Downloads/AutoSubtitle/
~/Movies/AutoSubtitle/
~/Documents/AutoSubtitle/
常见问题解答Q1: 支持哪些语言?A1: 目前支持包括中文、英语、日语、韩语等在内的多种语言互译。
Q2: 如何提高识别准确率?A2: 建议使用清晰的音频源,并选择合适的语音模型。
Q3: 字幕格式兼容性如何?A3: 支持主流的字幕格式,可以在各种播放器和剪辑软件中使用。
注意事项
处理大文件时请确保足够的存储空间
建议定期备份重要的字幕文件
注意遵守相关版权规定
重要项目建议进行人工校对
技术支持如遇到问题,可通过以下方式获取支持:
社区论坛: GitHub讨论区
邮件支持: hans.zheng1012@outlook.com
结语AI智能双语字幕生成软件为视频创作者和内容本地化工作者提供了高效的解决方案。通过本指南的详细说明,相信您已经掌握了软件的基本使用方法。持续关注软件更新,探索更多高级功能,让您的字幕制作工作更加轻松高效。