
你是不是常常遇到這些情況呢??
- 開完會議想整理重點,但光是聽錄音檔就要花上好幾個小時
- 做訪談研究,結果光是打逐字稿就累趴了
- 需要記錄演講內容,手打到手快斷掉...
別擔心!今天要介紹一個超強的 AI 夥伴 → OpenAI 開發的 Whisper!它不只能聽懂全球上百種語言,連中文都能精準辨識呢!最棒的是,它完全免費、開源,不用擔心付費訂閱或使用次數限制。
為什麼選擇 Whisper?
- 超強語言能力:可以處理各種口音、背景噪音,甚至是不同語言混雜的情況
- 完全免費:開源專案,不用花大錢買軟體
- 使用便利:只要有 Google 帳號就能開始使用
- 精準度高:特別是中文的辨識準確度相當令人驚艷
Whisper 使用教學:一步步帶你上手
1. 打開瀏覽器,搜尋「Google Colab」,找到它並點進去

2. 按下 Open Colab

3. 進入此畫面請先點擊右上角登入「Google」帳號

4. 點擊「檔案」→「在雲端硬碟中建立新筆記本」

5. 設定運行環境 : 點擊「執行階段」→「變更執行階段類型」

6. 設定運行環境 : 將執行類型設為 Python 3,硬體加速選擇 T4 GPU,然後按下儲存

7.安裝必要套件(複製以下程式碼並按下執行)
Whisper 安裝 : !pip install git+https://github.com/openai/whisper.git
FFmpeg 安裝 : !apt update && apt install ffmpeg

8.可以選擇隱藏安裝成功的結果

9.新增程式碼儲存隔並將以下程式碼複製貼上
轉換程式碼:!whisper "你的檔名.mp3" --model medium

10.點擊左側的「資料夾」圖示,選擇「上傳檔案」,將需要轉換的音檔(如 MP3 格式)上傳至 Google Colab

11.將程式碼中"你的檔名.mp3"替換成音檔的名字.副檔名,檢查副檔名要與音檔相同

12.按下「執行」,等待運行完成後,文字稿會顯示在下方結果區域中,左邊檔案區域也有多種格式提供下載

*若之後需要再次開啟此檔案,可在雲端硬碟中尋找「ColabNotebooks」的資料夾


⭐小提醒
- 建議上傳的音檔品質盡量清晰,這樣辨識效果會更好
- 如果音檔很長,可能需要等待一段時間
- 轉換完的文字建議稍微檢查一下,偶爾可能需要小修
這樣是不是很簡單阿!再也不用擔心逐字稿的問題啦~
趕快開始你的 Whisper 體驗吧!
絕好聲創提供文字轉語音以及 AI 有聲書出版、製作服務,擁有眾多高擬真臺灣口音 AI 人聲,可以為有聲書提供更自然、更富有情感、更有臺灣味的聲音。
點擊瞭解更多: https://www.voai.ai