Colab + WhisperX 將音檔轉成逐字稿

Colab + WhisperX 將音檔轉成逐字稿

前幾天在聽podcast時聽到一段不錯的內容,不過因為我用的不是 Apple Podcast, 沒有逐字稿,索性把之前在 colab 上跑的 fast whisper 拿出來用。但因為 podcast 是對談,想分不同的講者,於是找了一下有沒有 solution。發現大多是用 pyannote 去進行說話人分割 (diarization),然後再 對齊 (align)。 目前 whisperX 已經有支援。

whisperX 之前有「停更」過一段,今年又恢復更新。於是找了些資料,把 colab 的版本架了起來。後面又發現中文的斷句和標點有些麻煩, GPT 介紹的幾個作法不是不好用,就是有幻覺。最後還是選擇直接叫 GPT 來修飾文字,畢竟本來就是語言模型。

過程中發現 ChatGPT 很有耐心地關心我的需求和碰到的錯誤,真的像是要一步步地帶著我完成所有的程式碼。雖然產出的東西偶爾會有錯,我也會自己手殘去修改一些我要的邏輯。不過如果回饋給他,他會記住,並且在後續的版本持續完善整個程式碼。

這些 code 完全由我自己寫的已經 <50% 了, vibe coding 真是驚人。

閱讀全文

遊民週記 46: 新螢幕和校色

遊民週記 46: 新螢幕和校色

把病養好後,本週開始開turbo 趕進度回到之前的生活型態。
結果好像有點趕過頭了,星期三跟朋友聊天還在說自己很忙,星期四就突然不知道要做什麼事了。

事後回顧,其實也不是沒事做,待辦事項跟計畫還是有許多項目要完成。
只是當下突然沒有「即刻應該做」或是「當下想要做」的事。
才會有「啊~~~~ 這就是退休後很無聊、不知道做什麼事的感覺嗎?」

然後過了一天,又回到有事情做的日子了。

閱讀全文

在kodi 裡自動選好繁中字幕

在kodi 裡自動選好繁中字幕

如果你在 Kodi v21 裡碰到影片不會自動出現字幕,或是字幕總是先選擇了簡體中文,
可以試試以下的作法:

  1. 安裝 addon: service -> Language Preference Manager
  2. 打開 ” Turn on subtitles if a subtitle preference matched” 選項
  3. 設定 Subtitle Preference -> Enable Preference 以及 Language : Chinese
  4. 設定 Subtitle Keyword List: Simplified

閱讀全文

從Pocket Money (PM) 跳船到Moze 3

從Pocket Money (PM) 跳船到Moze 3

我用行動裝置記帳已經超過15年了。紀錄的第一筆是2002年9月18日,一直到現在已經有超過兩萬筆以上的紀錄 (還不包括2002-2007年的現金交易記錄)。對我而言,從一個記帳軟體跳到另一個,除了要考慮軟體好不好用,美不美觀,功能順不順手,最重要的,是資料能不能搬過去。

我的備份SOP (2018版)

我的備份SOP (2018版)

最近剛添購新硬碟,把一顆服役快九年的主力硬碟給換了下來。利用空間上新的優勢 (1TB –> 4TB),重新整理了資料存放的配置,也一併把備份策略再修改過。要了解這一個版本的脈絡,可以對著我的備份SOP (2016版) 跟 我的備份SOP 一起看,會更清楚。

用 Letsencrypt.sh 來自動 renew

用  Letsencrypt.sh 來自動 renew

官方的letsencrypt-auto說實話還是很慢,久久在背景跑一次沒差,要是自己手動跑就會受不了。如果是一次有一堆 domain 要 renew 的話會更慘。後來又看到gslin提到有個用 Shell Script 寫的 Let’s Encrypt Client,看起來還真的不錯,就找了點時間跑跑看。雖然還要土法煉一下鋼,不過速度快又方便,所以再次把設定方式分享出來。

用 Let’s encrypt 把 HTTPS 架起來

用 Let’s encrypt 把 HTTPS 架起來

之前就有在留意 gslin 提到的 Let’s Encrypt 這個免費的 SSL Certificate。不過因為忙,也不想當白老鼠,所以一直等到 Public Beta才開始拿一個網域測,測完覺得不錯後又悄悄地把 blog 升上 https。

升上https後又觀察了一陣子,一方面也怕不穩定或是對web server效能影響太大就拉下來,不過科技日新月異,比我想像的好多了。趁這個機會就把一些設定跟筆記丟上來。