Skip to content

Memo AI 模型下载

Memo AI 提供了多种本地语音转文字模型,你可以根据下面的列表选择下载。以下模型均经过测试,大概情况如下:

  1. 对于没有大段空白,背景音乐,噪音较多的英文音频, Whisper 语言模型可以达到 99% 的准确率,反之就很容易出现大量幻觉问题。
  2. 如果机器性能不好,转写出现重复概率也会增高。

Large-V1

Large-V1 模型可以转写超过 96 种语言,对于西班牙语,英语等语言,可以达到 99% 的准确率。对应的推理速度也会变慢。

  • 类型:高质量通用模型
  • 最低内存:16G
  • 推荐指数:🌟🌟🌟🌟
  • 下载链接:Large-V1

Large-V2

Large-V2 模型可以转写超过 96 种语言,对于西班牙语,英语等语言,可以达到 99% 的准确率。相比较 V1,性能提升,训练语料相应也有增加。

  • 类型:高质量通用模型
  • 最低内存:16G
  • 推荐指数:🌟🌟🌟🌟🌟
  • 下载链接:Large-V2

Large-V3

Large-V3 模型相对 V2 模型增加了训练语料,增加了粤语识别,但是对应的性能并不是很稳定,很容易出现重复内容输出。一般不推荐下载使用,除非拥有好的机器,同样音频质量也很好。

  • 类型:高质量通用模型
  • 最低内存:16G
  • 推荐指数:🌟🌟🌟
  • 下载链接:Large-3

Medium

Medium 训练的语料只有 Large 的部分,相对应转写英文,西班牙语料比较多的语言,会有好的质量。中文,日语通常错误会高一些。

  • 类型:高质量通用模型
  • 最低内存:8G
  • 推荐指数:🌟🌟🌟🌟
  • 下载链接:Medium

Distil-large-v3

这个对于英文内容断句比较优秀,转写速度快,质量也好。但是对于双语混杂情况,很容易出现问题。

  • 类型:高质量英语模型
  • 最低内存:16G
  • 推荐指数:🌟🌟🌟🌟
  • 下载链接:Distil-large-v3

Medium.en

Medium.en 训练的语料只有 Large 的部分,注意这个模型只能转写英文。

  • 类型:高质量英语模型
  • 最低内存:8G
  • 推荐指数:🌟🌟🌟🌟
  • 下载链接:Medium.en

Small

  • 类型:均衡通用模型
  • 最低内存:8G
  • 推荐指数:🌟🌟🌟🌟
  • 下载链接:Small

Small.en

  • 类型:均衡英文模型
  • 最低内存:8G
  • 推荐指数:🌟🌟🌟🌟
  • 下载链接:Small.en

Base

  • 类型:速度通用模型
  • 最低内存:8G
  • 推荐指数:🌟🌟🌟🌟
  • 下载链接:Base

Base.en

  • 类型:速度英文模型
  • 最低内存:8G
  • 推荐指数:🌟🌟🌟🌟
  • 下载链接:Small.en

Tiny

  • 类型:速度通用模型
  • 最低内存:8G
  • 推荐指数:🌟🌟🌟
  • 下载链接:Tiny

Tiny.en

  • 类型:速度英文模型
  • 最低内存:8G
  • 推荐指数:🌟🌟🌟
  • 下载链接:Tiny.en

中文与日文专属模型

仅对会员开放,请发送购买凭证给 hi@memo.ac,会邮件回复对应的模型下载链接。

模型使用教程

请前往 Memo AI 设置 - 模型管理 - 右上角点击导入模型,然后前往首页添加音频时候选择模型即可。通常推荐直接代理 https://huggingface.co/ 这个域名,不会出现下载为零的情况。

最后更新于:

让学习与创造更简单