這篇是求助文。
之前替我的文章分類時,就有不知道該分到何類的困擾。尤其是當一篇文章可能在多個分類時。
那好,來用Tag吧。可是,新的問題出現了,Tag要怎麼下? 下的太細,麻煩且不實際,下的太寬,真的要找的時候又派不上用場。
結果到最後,我自己最常用的還是輸入關鍵字去搜尋。
這一兩個月來,我開始用HEMiDEMi來整理書籤和資料。大量使用tag的結果,Tag的混亂更加惡化。
看看我的tag吧,已經多到我不知道該如何整理的地步了。(當然,跟某些人相比我還算小兒科)
我找不到一個方便遵循的原則,要替書籤下tag變成一件令人苦惱的事。我很怕這樣下去,亂到一個程度之後我又會回到使用搜尋功能的狀態。
這可能是屬於圖書館學的範疇(我可能是錯的),有沒有關於「如何下tag」,或是「tag要怎麼取/整理比較適當」的參考資料啊?
以前在”偷學”某家search engine技術時有過類似經驗.
對文章下tag或是keyword的方式, 通常寫作者本人會用自己書寫的概分法去做, 例如寫個電影的影評可能分類到”影評”區, 可是事實上不會有人特別跑來搜尋”影評”這類的keyword或tag, 反而”恐怖片”或”布萊德彼特”的效果來的更好.
也就是說, 應該是反向來看, 你希望哪個或哪些類別中出現這篇文章, 就下那些tag.
這樣說很模糊, 不過是我一時想的到的方法, 拙見請參考.
我通常是以「人、事、時、地、物」來下 TAG
我也是用這樣的方式去寫 PDA 行事曆
人:這篇文章跟誰有關係(稱呼或全名選一個,不要混用即可)
事:文章內容(唯一不下 TAG 的)
時:部落格本身就有紀錄完整日期時間
地:事情發生的地點
物;文章內討論的物品
如果文章只有談到人事,沒提到的就留白
因此搜尋文章的時候就只要回想一下「人事時地物」
以你這篇求助文,我可能就會下兩個 TAG
「我」「終極邊疆」
當我要搜尋文章的時候,指定兩個 TAG 再加上 KEYWORD「求助文」
很容易找到這篇求助文
分享給你~
希望對你有幫助!
我用del.icio.us的時候, 從不自己下keyword耶……XD
lazysheep bookmarklet好~
如果有像 del.icio.us 的 tag bundles 會在稍微好整理一點點吧@@
而且分的太細常常會忘記曾經 tag 過哪些..
del.icio.us的tag 可以大量批次更改, 就可以不用擔心tag要怎麼下. 比較符合人性. 否則要逐一修改每個書籤的tag會累死
我今天才替自己的網站加裝了 tag 功能,馬上發現自己不太會下標籤。所以搜尋到這邊來。我也有一樣的問題。
原本我想使用 tags 的原因是彌補分類的不足 — 分類似乎不應該太多,應該要有組織。Tags 則可以是很零散,隨性加上的東西。我原來的想法是,Categories 用來表示該文章在網站上的角色(公告、評論、隨筆、日記.. 等等),tags 則反映內容(拉麵啦、MacBook 啦、等等)。
不過實際上好像又沒那麼容易。例如,一篇影評到底要用「電影」的 tag, 還是「追殺比爾」, 還是都要?如果加入「追殺比爾」,可能整個網站(如果是愛寫影評的人的網站)就只有這麼一篇關於「追殺比爾」的文章,卻有一兩百篇「電影」。大家是否覺得這樣也沒關係?
另外就是該用中文還是英文。如果為了讓人找得到,似乎是用英文比較好?如果用中文,有選擇中譯名詞的問題(用哪邊的譯名?)。大家是用中文、英文,還是都用?
epicure:
您提到的這些點都是困擾我的地方。像是「電影」或是「電影名」,以及中文/英文,這些我在用HemiDemi的時候都碰到過。感謝你把問題說明得這麼好。
這些問題我還沒有什麼好答案,如果你想到什麼好主意的話記得告訴我 🙂
我的經驗,Tag 是一種自由的分類方式,可以取代Categories,但不應該與 Keyword 混淆。
常看到許多人用關鍵字的概念來下標籤,一團亂是必然的,還記得嗎?關鍵字是拿來搜尋的,是給機器用的,不是給人類用的。
所以簡單言之,一開始先設想好大概會用哪些標籤,去蕪存菁整理一下,之後原則上就只點選這些,可以複選;未來當然可以新增,但不是隨便增加,如果根本就只會出現在一兩篇之中,不具分類必要性,就不必新增。
預留兩三個比較彈性的,例如 Special, Temp 之類的,加入時不確定或感覺怪異的,就先加上這個標籤,日後不定時再整理一下。
我的原則是分類、標籤並行,分類為虛、標籤為實
分類讓你知道文章是哪一方面的東西,標籤直接讓人知道是什麼東西
我遇到的問題,還沒有解決
很多相似的Tags 因為時間久遠記憶力不好,用起來會產生很多不一致的標籤名稱
美味書籤所用的熱門建議標籤點選選擇,我不喜歡,他建議的未必是我想要的
我想出一個方案,用定義『相似』、『相關』語義的方式來做,只同時顯示一種,且多樣化輸入查詢
譬如,字典、辭典、詞典、詞海、詞源、辭海、辭源,只顯示一個名稱『字辭典』
點選、查詢、下標籤(不管下哪個),/tags/字典、/tags/詞典 時,都會自動導向、重定向到 /tags/字辭典 且列出可能相關、相似的標籤
這個做法在各個wiki系統 已經以廣泛應用,只是標籤系統還沒有實作
建議一下各種系統都能考慮實作這個功能
我覺得有點好奇的是:大家下TAG是為了日後的「搜尋」還是「應用」?如果只是要找文章的話,恐怕用系統內建的搜尋方式會比從TAG裡頭一一翻找要好;但如果是為了應用的話,應該事先想自己會怎麼使用這些文章,然後下TAG會比較有幫助?
Hi PipperL:
聽到你的心聲囉.. 我們也正在加強對tag的管理/整理工具. ^^
HEMiDEMi 5/25已經推出tag bundle的功能, batch rename也正在進行中.
就請你先試用tag bundle, 看能不能稍微改善
有什麼需要改進的再告訴我們~ 🙂
謝啦!
Hikaru
Hikaru:
感謝您的通知,我正在試用新推出的 Tag Bundle功能,初步感覺很直覺、很好用。感謝HemiDemi在這方面的努力 🙂
Tag 還是不要用中文,畢竟中文有詞意問題,差一個字意思可能就不一樣,而且看起來會很亂,英文雖然也有,但是可以比較準確的使用相關的單字,統一性跟一致性比較完整,另外就是全世界的人都可以看得懂,然後最好統一用小寫,如果有特例 ( 大小寫各有不同意思 ) 那就另外下 Tag,一篇文章或一個連結能下多少 Tag 就下多少 Tag,或者說能想到有什麼 Tag 跟其有關就儘量下,越多越好,因為人的記憶力有限,有時候會忘記當初保存的網站或連結是做什麼的,當 Tag 多的時候,只要其中一條 Tag 讓你想起來文章或網站的作用,那就成功了,以後搜尋起來,網站跟網站,關鍵字跟關鍵字之間的相關性也會更深,例如有兩篇主題風馬牛不相及的文章,但內容有共同的地方,Tag 就可以為其建立相關性,更好的就是像美味書籤一樣可以寫一段該網站的敘述,這樣一來只要有一套搜尋功能強大的引擎,就可以從 Tag、描述、網址等多方面下手,如此可以更精確的搜尋到想要的東西。
Alan:
不用中文的tag,在區域性的社會書籤服務(如以中文為主的 HemiDemi和MyShare)反而出現一個困擾,就是除了自己之外,很難跟別人的tag “扯上關係”。舉 HemiDemi 為例,使用英文Tag,會不易看到與自己下同一Tag的同好。
所以目前我的做法是….中文英文都下@@,然後下場就是tag cloud 雜亂不堪…Orz
我自己的標籤(就是我的最愛)是下給自己找尋方便,所以可能是一個大類分為己小類,幾小類又細分更小的(不要太多曾三層應該已經足夠),舉例來說目前我最熱衷戀愛巴士相關的事:第一層:電視台,第二層:細分為國內,日本,第三層:歸再日本之下:戀愛巴士官方網站(這裡指日本官方電台)。在第二層國內我又分為日本綜藝台`,其他(這是第三層),這裡我分到第四層日本綜藝台分成國興,緯來,jet。主要是建立分類觀念,生物不是分成界門綱目科屬種嗎?我就是利用相同觀念。
作為正在念圖書館學的,我想說明一下,傳統圖書館界有許多不同的「主題分析」方法與工具,如最常見的分類表,以及到台灣很少見,但是國外很常見的標題表(subject heading)等等。不論是分類表系統(如台灣用的中國圖書分類法、英文的杜威十進分類法DDC,美國國會圖書館分類法LCC),或是標題表系統(如 美國國會標題表LCSH),都是屬於控制詞彙的主題分析;也就是說,下分類或是下標題的圖書館員或是編目人員,必須一邊翻著厚厚的參考手冊(LCC有 ,LCSH有五冊超過270,000筆標題)。
在台灣圖書館科系中,中文編目跟西文編目都各是一學年的課程。除了記憶某些分類之外,還有許多組合標題的方法,稱為複分。如有形式複分、主題複分、年代複分、地理複分等等。中國圖書分類法就大約有49種不同的複分跟區分表。我大部分聽說同學當年上課的時候都是苦不堪言;我大學是非圖資科系的,所以沒吃過這種苦頭。
這些資訊可能不一定能直接回答你想要知道的「如何下」的問題。近年來中外圖資界也有以資訊行為研究的角度,對分類行為進行研究,但是仍然沒有一個簡單明瞭的答案。甚至頗具盛名的LCSH,美國也有研究建議要「廢除」的這種說法。目前只能說,如果希望分類能達到一致性、系統性、語義上又沒有問題,一堆苦工跟活罪是受不了的。
感謝 xxc 提供圖書館學上專業的看法。 那麼就您個人的看法,以目前來說,有沒有比較「自然」跟「方便」的處理方法?
做了一張表,
可以參考看看…
http://blog.roodo.com/genehong/67abc6ff.png
我想了想。最簡單的方法,就是不用把”tag”看作是找到資訊的唯一線索,就不會擔心沒有tag到或tag不完整,會不會以後就找不到的問題。因為就算是同一個網址,不同時間與情境下,都可能tag出不同的字出來。所以我想,先把tag當成一個主題分析的工作就好。
threeus 用人事時地物的方法作主題分析的固定面向,方法雖好,因為提供了分析的一致性。但是對某些人,像我自己,大致上都是以概念作分類的主題,因為我的檢索也大概都是由概念或主題開始,也就是最不容易下tag的「事」的部分。而對於網路資源的「事」的分析,說實在的圖書館界以往也沒有太有效的做法,所以才會讓Google獲得網路資源指引的主宰性地位。
當然,再把tag過的東西找出來,還是要作的工作。我比較同意像豬小草的做法,就是檢索時依賴的主要是平台的功能。我認為這是系統平台應該能作一些改善或加強的地方,其實應該能從tag與資源的語義網路結構中,找出一些相關性能有助於使用者檢索資料的;在資訊檢索的相關性演算法上,其實應該要能作到讓使用者更放心才是。
我會用人事時地物,主要是希望能減少 tag 。以前不去控制的話,經常會發生下 tag 完,整件事情也說明完了,我並不希望這樣。
由於一般搜尋系統都有全文搜尋,本文內容(事)的搜尋還是相當重要。我會用到 tag 縮小搜尋結果,多半是因為記得是誰(人)、或在哪裡(地)、或某樣東西(物),不記得情況下,還是得靠全文搜尋。
如你所敘述的,遇到最不容易下 tag 的事的部分,我就乾脆不下 tag 完全交給全文搜尋,反正這件「事」跟人時地物都沒有關連,最多就是下個「我」
說到這裡,也許搜尋功能要提供「例外 tag 」讓人選,搞不好我是想找跟某個人無關的、某個東西無關的「事」。
要高收視率的話,下A到Z,不然就是1到0,外加一些,./\?!等等
不過「競爭」應該也是蠻大的
容易分辨的話,就像圖書分類一樣,科學類、史地類、心理學類