使用 Memo AI,实现 5 分钟快速字幕翻译
AI 翻译字幕优势非常明显,上下文结合,更自然的语言。AI 在这点上毋庸置疑,就是好。但是劣势也很明显:
- 如果字幕的文件没有很好的断句,AI 会主动的聚合上下句,导致无法有好地拆分。
- 不便宜的转写费用,一小时字幕的转写费用至少 3~10 元不等,有时候还需要长时间等待才有字幕出现。
- 手动工作繁多,来回复制字幕给 AI,然后复制结果回文档,挺麻烦
- 批量单纯的一句句翻译实际和谷歌翻译差不多
第一步:认识 Memo AI
上面提到的 AI 这些问题,这些在 Memo AI 中都得到了很有效的解决。从音频转文字,文字翻译,Memo AI 都能帮你轻松解决。
- Memo AI 提供免费的本地语音转文字服务,只要设备性能足够,对应的英文转写正确率可以到 99%。
- 对于断句,Memo AI 提供了自动断句算法,帮你精准断句。
- AI 翻译自己配置 Key,自己消费多少钱心里有数。
- 自动处理,然后直接导出,远离手动来回复制。
第二步:下载 Memo AI
那第一步就是下载 Memo AI 了,Memo 是通过本地运行 AI 模型实现语音转文字。对应的设备也有一定要求,请确认自己至少 8G 内存。
Windows ARM
Version 1.3.10Windows ARM version is currently not available.
第三步:配置 Open AI 或者智谱 AI
首先你要先前往 Open AI 官网注册一个 Key,然后填写到 Memo 中。这里提醒一下,尽量提前检查是否已经充值付费?达到 Trie1 以上。接着就是来到 Memo 中,做一些配置处理。
- 复制已经创建好的 AI Key
- 前往 Memo - 设置 - 翻译设置中粘贴 Key,如果你不了解如何注册,可以谷歌以及点击旁边的问号来了解如何注册相关 AI
- 然后选择一下翻译选项为 Open AI,测试一下翻译效果
考虑到 AI 有多个版本,当下我们只推荐 gpt-3.5-turbo-16k 进行翻译,如果你选择了 GPT-4 等版本,存在报错是正常情况。因为当下还不适合进行批量和上下文翻译。
如果没有条件使用 Open AI,考虑使用国内的智谱 AI 实现翻译效果。
第四步:导入视频开始语音转文字
第三步,我们要稍微进行简单的设置才能开始转写任务。主要配置如下:
- 选择视频语言:视频里面讲的是什么语言就选择什么语言,这里不是翻译视频。
- 选择模型:Memo 提供速度、均衡、质量三种模型,如果设备性能够好,请直接选择质量模式,毕竟是 99% 的英文转写准确率。推荐 Medium.en。
- 选择加速:Memo Pro 支持 GPU 加速能力,语音转文字速度提升 2~10 倍。
- 增加提示词:这里主要是增加标点符号,增加提示词
,.
或者mama, you're always with the black queen.
带标点符号的句子,来提示 AI 自行在段落中增加标点符号。
Memo AI 在转写过程中支持实时展示,边看边浏览转写的内容。
过程中如果遇到无法语音转文字,右侧是一片空白,考虑是以下问题:
- 模型的存储文件夹名字有中文字符:可以前往设置 - 模型管理中更换一个无中文的地址。同样也避免选择文件夹名字中,有中文字符。
- 设备的内存 8G,但是选择了 Large 模型,Large 模型我们推荐需要至少 16G 甚至更高的内存。
- Windows 系统 且 CPU 是 ARM 芯片:目前暂不支持。
第五步:使用 AI 进行翻译
点击右上角翻译按钮,选择 Open AI,Memo AI 支持实时翻译展示。
第六步:导出字幕或翻译好的文件
在视频的右上角,点击导出按钮,然后选择想要导出的文件文件类型,比如字幕用 SRT、普通文本用 TXT,至此就完成了 AI 翻译字幕的效果。既省钱又省力。
常见问题
如果视频中有双语,怎么更好的识别?
语言选择 Auto,选择 Large 模型,提示词中添加视频双语中提到的句子,类似:**It's about as far ahead as we can see. 你讲的挺好。**实现精准双语识别。
出现了合并怎么处理?
AI 没有办法保证百分百按照提供的句子,逐行翻译。Memo 本身有提供单行翻译,点击翻译段旁边的重新翻译按钮,校验一下重新翻译。