Skip to content

Memo AI で音声文字起こしを高速化する方法

ネイティブの Whisper 文字起こし速度が遅いことを考慮し、Memo は GPU 加速機能を提供しています。マシンの性能が十分であれば、1時間の音声を2分で文字起こしすることが可能で、クラウドアップロードによる文字起こしよりも高速です。さらにプライバシーも確保できます。金融、建築などの機密性の高い会議の議事録作成に特に適しています。

有料機能のお知らせ

加速機能は有料機能です。価格ページから関連プランを選択してください。ご支援ありがとうございます。

macOS

Mac Intel マシンは現在 GPU 加速に対応していません。GPU モードをご使用ください。

M チップでの加速を有効にする方法

  1. 文字起こし時に GPU を選択し、8GB以上のメモリがあることを確認してください。大規模モデルの場合は16GB以上が必要です。
  2. そのまま文字起こしをクリックするだけです。

M チップは、より低スペックのデバイス向けに CoreML モードもサポートしています。

M チップの速度テスト

チップモデルメモリ理論演算性能 (FP32)1時間の音声文字起こし時間
M1 Max64G10.4 TFLOPS4.5 分
M2 Max64G27.2 TFLOPS3.5 分

Windows オペレーティングシステム

NVIDIA グラフィックスカードの場合、Cuda モードで Large 以上のモデルを実行するには、最低6GBのビデオメモリが必要です。

Windows での加速を有効にする方法

  1. グラフィックスカードドライバが最新であることを確認してください。Geforce Experience を通じて更新するか、検索エンジンで NVIDIA グラフィックスカードドライバのウェブサイトを検索し、お使いのデバイスモデルを選択して、対応するドライバをダウンロードしてインストールしてください。
  2. Cuda ドライバが12.2であることを確認してください。12.2より低いまたは高いバージョンの場合、Memo は対応するドライバをパッケージ化していますので、直接ダウンロードできます。

速度テスト結果

グラフィックスカードCUDA コア数理論演算性能 (FP32)1時間の音声文字起こし時間
RTX 40901638483 TFLOPS2.0 分
RTX 4080S1024067 TFLOPS3.5 分

対応グラフィックスカード一覧

Memo は大多数の家庭用グラフィックスカードに対応しています。企業向けや専門家向けグラフィックスカードの場合は、グラフィックスカードドライバが完全にインストールされていることを確認してください。例えば、Tesla T4 は TCC(Tesla Compute Cluster)モードのみをサポートし、Direct3D を使用するには追加のライセンスドライバのインストールが必要です。

2023 - 2024

RTX 4080S、RTX 4070Ti S、RTX 4070S、RTX 4090、RTX 4080、RTX 4070Ti、RTX 4070、RTX 4060Ti、RTX 4060

2019 - 2022

RTX 3090Ti、RTX 3080Ti、RTX 3070Ti、RTX 3090、RTX 3080 12GB、RTX 3080、RTX 3070、RTX 3060Ti、RTX 3060、RTX 2080Ti、RTX 2080S、RTX 2080、RTX 2070S、RTX 2070、RTX 2060S、RTX 2060

2014 - 2019

GTX 1080Ti、GTX 1080、GTX 1070Ti、GTX 1070、GTX 1060、GTX 980Ti、GTX 980、GTX 970

学習と創造をよりシンプルに