Colab + WhisperX 將音檔轉成逐字稿

Colab + WhisperX 將音檔轉成逐字稿

前幾天在聽podcast時聽到一段不錯的內容,不過因為我用的不是 Apple Podcast, 沒有逐字稿,索性把之前在 colab 上跑的 fast whisper 拿出來用。但因為 podcast 是對談,想分不同的講者,於是找了一下有沒有 solution。發現大多是用 pyannote 去進行說話人分割 (diarization),然後再 對齊 (align)。 目前 whisperX 已經有支援。

whisperX 之前有「停更」過一段,今年又恢復更新。於是找了些資料,把 colab 的版本架了起來。後面又發現中文的斷句和標點有些麻煩, GPT 介紹的幾個作法不是不好用,就是有幻覺。最後還是選擇直接叫 GPT 來修飾文字,畢竟本來就是語言模型。

過程中發現 ChatGPT 很有耐心地關心我的需求和碰到的錯誤,真的像是要一步步地帶著我完成所有的程式碼。雖然產出的東西偶爾會有錯,我也會自己手殘去修改一些我要的邏輯。不過如果回饋給他,他會記住,並且在後續的版本持續完善整個程式碼。

這些 code 完全由我自己寫的已經 <50% 了, vibe coding 真是驚人。

閱讀全文

遊民週記 11: 暑假開始了

遊民週記 11: 暑假開始了

上週提到的暑假「哇哇叫大作戰」,目前已經跟孩子一起完成進行方式規劃跟第一週的安排。接下來就是第一週看實行的狀況,再進行修正。想一想,人生有多少次可以兩個月不用上班,跟不用上學的孩子們好好泡在一起,而且又避開孩子很小 (著眼在「養」孩子)跟孩子很大 (孩子已經不想跟你泡在一起了) 的這兩個階段。想一想,就拋棄所謂的「暑假鬼門開」,放下原來在bucket list 上想要做的事情 (當然有的還是可以排,只是要跟孩子討論好再去做),把這兩個月專心拿來跟他們泡在一起。希望未來回顧這段旅程時,不管是對他們,還是對我自己而言,都是很難忘、很美好、也很珍貴稀有的兩個月。

閱讀全文