Skip to content

Memo AI 新功能的通知

Memo AI 提醒

Memo AI 建議在有超過16G記憶體的裝置中使用,以獲得更好的體驗,裝置的配置越好,轉寫的速度就越快。

2024-08-29 v1.3.8

新功能

  • 增加 YouTube 字幕下載功能,支援下載上傳字幕和自動生成字幕
  • 增加字幕一鍵匯出至 Obsidian (兩小時以內的影片字幕)
  • 匯出文字支援展示段落和單行的模式
  • 啟動系統優化,支援展示啟動裝置、移除裝置、擴展裝置數量等
  • 跳轉字幕剪輯介面後,同步播放進度
  • 支援標題重新命名,請雙擊標題重新命名

修復

  • 批次任務修復插入連結和刪除連結無效
  • 批次任務處理空間中文路徑
  • 修復翻譯返回內容可能超過原文導致的軟體錯誤
  • 修復繼續翻譯無法停止的問題
  • 字幕剪輯介面點擊編輯中的文字時不再自動播放影片

Windows

Windows 10, 11

Download (v1.3.8)

Apple Silicon(M)

macOS 12, 13, 14, 15

Download (v1.3.8)

Apple Intel

macOS 12, 13, 14, 15

Download (v1.3.8)

2024-08-05 v1.3.7

  • feat:支援 Ollama 本地 AI 模型摘要,目前測試 72B 以下模型思考導圖轉換有問題,調試提示詞中,如果在意生成效果問題,請使用線上 OpenAI 或者自定義相關適配 OpenAI 的模型。
  • feat:支援剪輯模式手動插入字幕行
  • feat:匯出文字支援設置顯示序號、說話人、時間戳
  • fix:調整並發滑條為下拉
  • fix:修復首頁列表點擊無法跳轉到詳情的問題
  • fix: 修復tts影片匯出報錯

小提示:

  • 如果你的裝置記憶體低於 8G,謹慎使用高品質模型,很容易造成軟體閃退,建議升級硬體獲得更好的使用體驗。
  • YouTube 最近升級了演算法,如果代理 IP 被濫用過,轉文字過程中容易報錯。
  • 使用 Windows 的朋友如果有 N 卡,請嘗試 Cuda 模式,穩定,速度更快。
  • 使用 macOS 的朋友,請使用 GPU 模式,CoreML 載入速度遠不及 GPU,且需要額外下載模型和穩定性不高。

2024-07-12 v1.3.6

  • feat: 改造播放器控制條,優化播放器常用快捷鍵
  • feat: 增加擴展包管理介面
  • feat: 調整最小視窗寬度限制
  • feat: AI翻譯增加單行翻譯和並發
  • feat: 支援匯出和匯入雙語字幕
  • feat: 支援字幕剪輯頁面點擊時間進行更改
  • fix: 更改TTS提示object的問題
  • fix: 修復過濾完關鍵詞之後還剩下空字幕的問題

2024-06-05 v1.3.5

  • feat: 默認開啓 100% cuda 加速
  • fix: 修復了說話人識別字幕顏色展示問題

2024-06-03 v1.3.4

  • Feature: 優化回饋方式,請點擊左下角幫助與支援-報告錯誤,直接回饋您的問題
  • fix: 修復了缺少翻譯字幕的時間線

2024-05-29 v1.3.3

  • feat:全新的 Cuda 與 Mac M 晶片加速,推薦啟用,特別是 NVIDIA 顯卡可以獲得 110% 的 轉寫加速。請前往設置 - 實驗室 - 啟用 flash attention 機制
  • feat:轉寫面板支持斷句開關,如遇到斷句不準或者大段情況,請更換模型或者提示詞中輸出“,。”兩個標點符號,提示 AI 恢復標點符號。
  • feat:音頻支持懸浮窗口播放字幕
  • feat:音頻播放器支持記錄觀看進度
  • feat:說話人識別支持進度載入
  • feat:OpenAI 支持配置自定義模型和 Host
  • feat:增加重新轉寫片段進度
  • feat:優化蒐索高亮,以及蒐索交互
  • feat:優化 Pro 介面交互
  • fix:修復批量模式無法導出

2024-05-10 v1.3.2

  • 功能:新增講者辨識安裝
  • 功能:支援批量選擇vtt和srt來建立轉寫和翻譯
  • 功能:當轉寫檔案時,清除翻譯內容
  • 功能:新增視頻編碼解析度選擇
  • 功能:使用獨立語言包,支援手動添加軟體語言包
  • 功能:當匯出選擇的片段,只播放選定的時間範圍
  • 功能:支援框選列表中的部分字幕重新轉寫,方便進行重複內容和多語言內容的單獨轉寫
  • 功能:播放器使用ass來顯示字幕
  • 功能:Windows GPU檢測語言優化,更準確地檢測原始音訊語言
  • 功能:字幕支援調整垂直位置
  • 功能:支援導出到Word,重構導出選項
  • 功能:播放器支援使用ASS字幕播放
  • 功能:當導出到Notion時,增加雙語支援
  • 修正:修復字幕渲染順序和邊框寬度問題
  • 修正:在合成語音時,檢查字幕是否存在,以避免產生無效音訊檔案
  • 修正:字幕字體支援設定更小的字型大小
  • 修正:同步時間軸修改,以更新其他頁面狀態

2024-04-10 v1.3.0

主要更新:

Memo現在支援導出合成的音訊和視訊。

如何使用:轉寫音訊,翻譯對應的字幕,點擊 TTS 選擇服務進行轉換,然後點擊導出並啟用音訊合成選項。

1.3.0 更新概述

  • 功能:合成音訊和視訊導出,同步支援GPU加速
  • 功能:新增日語模型
  • 優化:Windows 顯示標題欄符合 Windows 設計規範
  • 優化:改善音訊合成操作介面,新增文字提示
  • 優化:轉寫字幕後,翻譯預設為清除

2024-03-26 v1.2.2 Beta

  • 功能:支援 elevenlabs 服務
  • 修正:修復插件無法顯示的問題
  • 修正:修復線上視頻無法轉寫的問題

2024-03-17 v1.2.1 Beta

  • 功能:新增剪輯編輯,可以通過字幕進行視訊編輯和導出 #195
  • 功能:新增 Twitter 內容翻譯,目前不支援 Space
  • 功能:更新了預設插件和插件列表,新增函數以實時獲取最新的線上插件列表
  • 功能:調整了首頁卡片的對齊方法
  • 修正:修復了啟動時未檢查未完成的任務,修復了翻譯中的空內容會導致白屏的問題
  • 修正:優化了導出預覽時的字幕效能
  • 修正:修復了編輯原始字幕會自動保存並將游標移到最後的問題 #217 #216 #215

2024-03-13 v1.2.0 Beta

  • 功能:新的翻譯服務設定介面,語言模型介面分割,翻譯插件可以在整合中下載。
  • 功能:Open AI 和其他AI的自訂提示的支援。
  • 功能:Claude、Ollama 的本機AI翻譯支援,請在整合中添加。
  • 功能:翻譯支援持續翻譯、中斷翻譯,並可以很好地解决斷裂句子合併的問題 #174。
  • 功能:增加了shift間隔選擇編輯 #206。
  • 功能:播放歷史紀錄的支援 #42。

2024-03-05 v1.1.9 Beta

  • 優化:在字幕編輯中添加序列號和每秒字數統計資訊
  • 優化:當在首頁拖曳或選擇字幕,如果沒有正在進行的轉寫任務,直接前往詳細資訊
  • 修正:日語轉寫結果的問題
  • 修正:無法連結本地檔案的問題
  • 修正:在詳細資訊標題欄中的自動省略號問題
  • 修正:#176 在命名自訂資料夾時無法輸入空格的問題
  • 修正:標題在詳細頁被按鈕覆蓋的問題

2024-02-28 v1.1.8 Beta

  • 修正:Temo包裹問題
  • 修正:中文字幕導出問題
  • 修正:添加了 Memo 退出警告

2024-02-26 v1.1.7 Beta

  • 功能:雙語字幕編輯和視頻編碼,無需分開導出和匯入字幕進行後期製作
  • 功能:通過向 Memo 拖放字幕檔案,進行獨立字幕翻譯
  • 功能:字幕的位置和順序可以互換
  • 功能:添加了 Temo,支援將文字翻譯為音訊,現可作為 Memo 內的單獨應用程式進行試用

2024-01-16 v1.1.6 Beta

  • 功能:新增第三方整合以進行翻譯插件
  • 功能:軟體支援系統變更後的主題更變
  • 功能:提高了選擇簡體與繁體中文之間選擇的能力
  • 功能:實驗室新增獨立字幕浮動視窗
  • 插件:騰訊翻譯插件
  • 插件:雙子星翻譯插件
  • 插件:小牛翻譯插件
  • 修正:修復了由於檔案名中的特殊字符而影響播放的問題
  • 修正:修復了本地 SRT 檔案上載 - 不適合使用的問題
  • 修正:修復了下載模型可能發生兩次的問題
  • 修正:修復了加載 Bilibili 和 YouTube 的問題
  • 修正:修復了邊欄字幕無法搜尋字型的問題
  • 修正:修復了在 macOS 打開記事視窗時底部圖示消失的問題

2023-12-25 v1.1.5 Beta

新功能

  • 優化轉寫結束事件以避免提早結束
  • 首頁可通過拖放啟動轉寫
  • 在RSS中增加轉寫按鈕
  • 批次任務增強:新增 VAD 選項並支援在導出時選擇語言

Bug修復

  • 移除打開網頁的快捷方式
  • 從批次任務導航到詳細頁面的固定解決方案
  • 解決無法從批次任務導出字幕檔案的問題
  • 解決TTS無法從空字串中產生聲音的問題

2023-12-21 v1.1.4 Beta

現在,你可以在轉寫過程中無縫切換頁面,大大提高了用戶的體驗。

  • 特色:語音檢測,對細微語句片段和冗餘內容的有效對策。請在轉寫頁面的進階設定中啟用此功能。
  • 腦圖工具再次升級,方便輸出SVG和JPG格式。此外,它現在支援Markdown編輯。
  • AI翻譯功能已得到提升,提供了翻譯的迭代,更精準且更自然的表達方式。

2023-12-09 v1.1.3 Beta

特色

  • AI Mind Map:您的視訊可以一鍵進行摘要成吸引人的腦圖。 (此功能現在仍在試驗階段,還在最佳化中)
  • RSS: 視訊可以通過 Youtube 私人連結進行訂閱 (此功能現在仍在試驗階段,還在最佳化中)
  • 增加3倍視訊播放速度
  • 增加了 Core ML 加速

最佳化

  • 支援編輯後自動儲存

2023-12-03 v1.1.2 Beta

  • 微軟翻譯支援超長文字翻譯
  • 增加了廣東話選項
  • 空間邏輯優化,預設內建空間
  • 優化了批量模式效能問題
  • 簡體和繁體中文的轉換進行了優化

2023-11-26 v1.1.1 Beta

  • 修正了下載問題
  • 修復翻譯問題
  • 最佳化了操作經驗和提示

2023-11-24 v1.1.0 Beta

  • 模型:支援 Whisper V3,目前只對 Mac 版和 Windows CPU 適用
  • 模型:最佳化初始模型載入體驗
  • 字幕:最佳化了批量操作樣式,暫時移除了拖拉和多選特性,將在下一版本更新,請使用右鍵方式進行多選。
  • 批量:支援 Prompt 參數

2023-11-15 v1.0.13 Beta

功能

  • Open AI TTS
  • volcengine TTS

2023-11-06 v1.0.12 Beta

功能

  • 添加 Distil-Whisper 模型,近支援英語
  • 添加空間隔離 (老數據暫不支援遷移,可以在各個空間中查看)
  • 自動清除歷史任務列表,刪除資源目錄任務自動移除傳輸和任務備份文件

最佳化

  • 首頁輸入框添加連結前顯示傳送按鈕
  • 移除模型管理頁面模型資料夾顯示,調整導入模型按鈕
  • 調整已選音譯語言的列表
  • 調整批量任務啟動和任務列表失敗消息提示
  • 修復了 macOS x64 vad 不工作的問題
  • 移除 VAD 模式,自動使用寬鬆模式,調整 VAD 預設閾值

2023-11-04 v1.0.11 Beta

功能

  • VAD,防止 whisper 幻聽。
  • 字幕合成音訊導出
  • 批量音訊與視訊的轉換

最佳化

  • 增加翻譯語種,羅馬尼亞語、維吾爾語、烏茲別克語、哈薩克語、阿塞拜疆語、吉爾吉斯語、波斯語、塔吉克語
  • Windows GPU 支援自動檢測語言
  • 移除自動標點設定以簡化操作。如果遇到自動標點失敗,請添加提示: "請添加標點。"
  • 最佳化了一些快捷鍵和提示,如在首頁打開轉場面板 (Alt/Option + O) 、模型滾動 (Alt/Option + M) 、開始轉場 (Alt/Option + S)
  • 支援轉寫時使用低品質視頻 (設定-lab Open)
  • 增加批量時字幕導出
  • 支援更自然的字幕跟隨滾動效果
  • 修正了無法傳送已下載視訊的問題
  • 修正下載標題過長不能以上轉發

2023-10-20 v1.0.10 Beta

🐞捕獲了幾隻跳躍的蟲子。

2023-10-16 V1.0.9 Beta

功能

  • Memo 批處理功能的基礎版本

最佳化

  • 將重寫按鈕移到螢幕的右上角
  • 優化了簡體中文提示,輸出簡體中文更精確
  • 增加了 Ts,OGV,3GP,VOB,WTV 格式檔案的支援

2023-09-25 V1.0.8 Beta

功能

  • Mac M 系列晶片支援 GPU 加速
  • 標題設定面板進行重構
  • 傳輸面板支援拖放調整視頻大小
  • 支援 CHATGLM 翻譯
  • Memo Pro 支援啟動碼

最佳化

  1. 實際上已支援壓制導出用於媒體導出。但效果仍有最佳化空間,我們隨後最佳化優化使用。如果要導出雙語字幕,記得選擇右上角的雙語,然後去導出。
  2. 支援文心的摘要 3.TTS 支援文字合成語音
  3. 修復了一行翻譯會導致全文丟失的問題
  4. CLIP 模式時間軸針對文字支援拖放,修復了調整寫字幕時間未實時顯示的問題

2023-09-13 V1.0.7 Beta

功能

  • 文字,字幕合成語音
  • 多語言:支援繁體中文介面
  • 導出:支援 TXT,雙語導出

最佳化

  1. 支援百度雲智能雲翻譯;
  2. 最佳化提示方塊;
  3. 支援導航列折疊和展開;
  4. 進階下載能力內嵌。如果無法下載且有載入情況,請到設定-實驗室關閉下載。

2023-08-28 V1.0.5 Beta

功能

  • 轉寫:新的 Windows GPU 加速
  • 轉寫:Mac 支援 coreML 加速
  • 翻譯:Open AI 翻譯

最佳化

  • UI 變更,筆記 UI 變成圖示,介面更一致。
  • 翻譯支援長文字,Google 因為支援長文字,如果頻繁呼叫會封鎖 IP。後續會提供填寫 Key 的方式。
markdown
-  自動更新,自動 update,不需要手動下載。

## 2023-08-13 V1.0.4 Beta 

-  筆記:滑過筆記,快速時間戳,截圖!
-  字幕:支援本地字幕的導入,雙語字幕的導出
-  翻譯:支援翻譯配置測試,介面樣式修訂
-  播放器:支援劇院模式
-  空間:內容隔離,家人共用一部電腦看到不同的內容

## 2023-07-22 V1.0.3 Beta

-  翻譯:支援更多翻譯平台:火山,Deepl,Microsoft 翻譯
-  字幕:支援編輯字幕和一行翻譯
-  播放:支援全屏字幕

## 2023-07-12 V1.0.2 Beta 

-  剪輯:段落剪輯,粗剪更高效-滾動字幕
-  代理:優化代理獲取邏輯
-  導入:Notion 導入支援

## 2023-07-06 V1.0.1 Beta

這次帶來了翻譯能力,最多支援到九十六種語言。

## 2023-06-13 V1.0.0 Beta 

初次發布算是一個小的里程碑。在初次發布中,具備以下能力:
1. 多格式:MP3、WAV、AAC、M4A、MKV、AVI、MP4、MOV 等格式都支援導入
2. 多語種:支援中文、英文、Deutsch、LTALIANO。{}、日語
3. 自定義提示:可以讓AI認識如果是在四川人還是河南,n還是英文。你可以說「這是四川話」,就能識別出四川話
4. 導出:支援像 Markdown、字幕 SRT 等常見的導出格式
還有實時字幕預覽,實時串流,批量替換,字幕合併等更多的功能尚待探索!

最後更新於:

讓學習與創作更簡單