如何使用 Memo AI 加速语音转文字时间?
考虑原生 Whisper 转写速度很慢,Memo 提供了 GPU 加速能力,如果你的机器够好,完全可以实现 2 分钟转写 1 小时音频,比云端上传等转写的速度还快,同时还能保证隐私。特别适合金融、建筑等私密会议的文稿生成场景。
付费功能提示
加速能力需要付费解锁,可以前往 定价 页面选择相关套餐,感谢您的支持。
macOS
Mac Intel 机器暂时不支持 GPU 加速,请使用 GPU 模式。
如何启用 M 芯片下加速
- 转写时选择 GPU,确保内存有 8G,如果是大模型,确保有 16G。
- 直接点击转写即可。
M 芯片还支持 CoreML 模式,供更低端设备使用。
M 芯片测速
芯片型号 | 内存 | 理论算力 (FP32) | 一小时音频转写时间 |
---|---|---|---|
M1 Max | 64G | 10.4 TFLOPS | 4.5 分钟 |
M2 Max | 64G | 27.2 TFLOPS | 3.5 分钟 |
Windows 操作系统
对于 NVIDIA 显卡, Cuda 模式下,如果需要运行 Large 以上模型,则需要至少 6G 显存。
如何启用 Windows 加速?
- 确保显卡驱动已经升级到最新,比如通过 Geforce Experience 更新,也可以搜索引擎检索 NVIDIA 显卡驱动网站,选择你的设备型号,下载对应的模型安装。
- 确保 Cuda 驱动是 12.2,如果版本低于或者高于 12.2,Memo 已经打包好对应的驱动,直接点击下载即可。
相关测速
显卡型号 | CUDA 核心数 | 理论算力 (FP32) | 一小时音频转写时间 |
---|---|---|---|
RTX 4090 | 16384 | 83 TFLOPS | 2.0 分钟 |
RTX 4080S | 10240 | 67 TFLOPS | 3.5 分钟 |
显卡支持清单
Memo 支持大多数家用级别显卡,如果是企业级,专业级显卡,请确保显卡驱动安装完整。比如 Tesla T4 只支持 TCC(Tesla Compute Cluster)模式,Direct3D 需要额外安装授权驱动才能使用。
2023 - 2024
RTX 4080S、RTX 4070Ti S、RTX 4070S、RTX 4090、RTX 4080、RTX 4070Ti、RTX 4070、RTX 4060Ti、RTX 4060
2019 - 2022
RTX 3090Ti、RTX 3080Ti、RTX 3070Ti、RTX 3090、RTX 3080 12GB、RTX 3080、RTX 3070、RTX 3060Ti、RTX 3060、RTX 2080Ti、RTX 2080S、RTX 2080、RTX 2070S、RTX 2070、RTX 2060S、RTX 2060
2014 - 2019
GTX 1080Ti、GTX 1080、GTX 1070Ti、GTX 1070、GTX 1060、GTX 980Ti、GTX 980、GTX 970