Memo AI で音声文字起こしを高速化する方法
ネイティブの Whisper 文字起こし速度が遅いことを考慮し、Memo は GPU 加速機能を提供しています。マシンの性能が十分であれば、1時間の音声を2分で文字起こしすることが可能で、クラウドアップロードによる文字起こしよりも高速です。さらにプライバシーも確保できます。金融、建築などの機密性の高い会議の議事録作成に特に適しています。
有料機能のお知らせ
加速機能は有料機能です。価格ページから関連プランを選択してください。ご支援ありがとうございます。
macOS
Mac Intel マシンは現在 GPU 加速に対応していません。GPU モードをご使用ください。
M チップでの加速を有効にする方法
- 文字起こし時に GPU を選択し、8GB以上のメモリがあることを確認してください。大規模モデルの場合は16GB以上が必要です。
- そのまま文字起こしをクリックするだけです。
M チップは、より低スペックのデバイス向けに CoreML モードもサポートしています。
M チップの速度テスト
チップモデル | メモリ | 理論演算性能 (FP32) | 1時間の音声文字起こし時間 |
---|---|---|---|
M1 Max | 64G | 10.4 TFLOPS | 4.5 分 |
M2 Max | 64G | 27.2 TFLOPS | 3.5 分 |
Windows オペレーティングシステム
NVIDIA グラフィックスカードの場合、Cuda モードで Large 以上のモデルを実行するには、最低6GBのビデオメモリが必要です。
Windows での加速を有効にする方法
- グラフィックスカードドライバが最新であることを確認してください。Geforce Experience を通じて更新するか、検索エンジンで NVIDIA グラフィックスカードドライバのウェブサイトを検索し、お使いのデバイスモデルを選択して、対応するドライバをダウンロードしてインストールしてください。
- Cuda ドライバが12.2であることを確認してください。12.2より低いまたは高いバージョンの場合、Memo は対応するドライバをパッケージ化していますので、直接ダウンロードできます。
速度テスト結果
グラフィックスカード | CUDA コア数 | 理論演算性能 (FP32) | 1時間の音声文字起こし時間 |
---|---|---|---|
RTX 4090 | 16384 | 83 TFLOPS | 2.0 分 |
RTX 4080S | 10240 | 67 TFLOPS | 3.5 分 |
対応グラフィックスカード一覧
Memo は大多数の家庭用グラフィックスカードに対応しています。企業向けや専門家向けグラフィックスカードの場合は、グラフィックスカードドライバが完全にインストールされていることを確認してください。例えば、Tesla T4 は TCC(Tesla Compute Cluster)モードのみをサポートし、Direct3D を使用するには追加のライセンスドライバのインストールが必要です。
2023 - 2024
RTX 4080S、RTX 4070Ti S、RTX 4070S、RTX 4090、RTX 4080、RTX 4070Ti、RTX 4070、RTX 4060Ti、RTX 4060
2019 - 2022
RTX 3090Ti、RTX 3080Ti、RTX 3070Ti、RTX 3090、RTX 3080 12GB、RTX 3080、RTX 3070、RTX 3060Ti、RTX 3060、RTX 2080Ti、RTX 2080S、RTX 2080、RTX 2070S、RTX 2070、RTX 2060S、RTX 2060
2014 - 2019
GTX 1080Ti、GTX 1080、GTX 1070Ti、GTX 1070、GTX 1060、GTX 980Ti、GTX 980、GTX 970