May 16, 2006

傳送至 Kindle
互動式隨選列印/另存成 PDF

[敲打鍵盤]從後設資料看 CC

這一篇是我給自由軟體鑄造場電子報的稿件,刊登於第五十七期。從這一篇起,我在自由鑄造場電子報的專欄名稱正式定名為「開放原力」,請大家多多捧場指教。

從後設資料看 CC

熟悉 Creative Commons (CC) 的朋友應該都知道,任何一種創用 CC 授權條款都有三種表達方式:法律條款、數位標籤以及授權標章;這三種授權條款的表達方式彼此相輔相成,共同構成了創用 CC 的運行世界。這是整個 CC 的精要所在,也是 CC 異於其他任何公眾授權 (Pubilc Licenses) 之處。

之所以 CC 會有這樣的設計,其實跟 CC 發起人之一 Lawrence Lessig 的科技法背景是脫不了干係的。 Lessig 身為律師,在他所建構的 CC 世界觀中,乃是個法、理、情兼重的世界:「法」指的是法律條款,是 CC 授權的核心,也是最嚴謹、最後的一道防線;「理」指的是數位標籤,是全然理智、講邏輯的數位世界中,讓電腦程式也能精確判讀的後設資料;而「情」指的是授權標章,是為了讓任何人都可以輕易明白授權條款的概要而存在的。

雖然說這三者並重,但是法律條款無疑地具有絕對的效力,而授權標章卻完全沒有任何法律價值。法律條款純為法律目的而存在,完全不顧及一般人是否看得懂;授權標章則純為一般人而做,因此在措辭、概念傳遞上,完全不具法律文件的精確性。那麼,數位標籤呢?

數位標籤是 CC 授權條款極為重要的一環,卻也是最常被忽略的一環,因為在此刻的 CC 世界中,參與最為活躍的不外乎律師和藝人,這些人最為熟悉的乃是法律條款及授權標章;而對於資訊技術最為熟悉的程式設計師與工程師們來說, CC 的參與卻還有相當大的發展空間。在 Lessig 所設想的「理想的數位世界」中,一切的程式碼猶如現實世界中的法律條文一般,規範左右著數位內容與數位身分,然而要達到這個境界前,勢必要先將現實世界中抽象的「關係」給具體化描述出來;用來描述這些內容的,正是後設資料。

換而言之, CC 世界中的數位標籤,仰賴著各種數位內容皆有完備的後設資料格式纔得以落實。 CC 發展的頭幾年,若干原本就內嵌後設資料的檔案格式,很快地也跟著得以嵌入 CC 授權的後設資料。例如 HTML/XHTML 、 RDF 、 RSS 、 SMIL 、 XMP (PSD, PDF) 、 MP3 、 Ogg Vorbis 等,這些檔案格式的後設資料要如何加入 CC 授權的資訊,均已經可以從創用 CC 網站 http://creativecommons.org.tw/static/technology 查得。

可是當今的數位世界距離 Lessig 理想中的樣子還非常遙遠。當我們回過頭去檢視這些嵌入於內容的 CC 授權資訊時,馬上能發現有些實做顯然是囿於各種規格的先天障礙,而採行的權衡之策;例如 XHTML 或 SMIL 所嵌入的 CC 授權資訊,本質上是 RDF 格式的後設資料,有著對各種授權要素(例如:允許衍生著作,要求相同方式分享等)的等價表示,但是像 MP3 及 Ogg Vorbis 內,卻祇能運用 ID3 標籤或 Ogg 註解欄位來存放授權標章的網址。這兩種嵌入後設資料的方法,實際嵌入的資訊詳細程度有著不小的差距,自然而然地就會帶來一些迷惘:如果有授權標章的網址就夠了的話,何必要逐一著錄授權要素呢?如果需要著錄授權要素纔算完整的話,那麼僅標示授權標章網址的作法是否不夠強猛有力 (robust) 呢?

前面提過,法律條款祇管法律的需求,授權標章祇管普羅大眾的需求,但是數位標籤在實做上如果僅提供了授權標章網址,一方面會增加授權標章的負擔,另一方面則會減弱數位標籤的效力,不但有違三種表現方式各司其職、互蒙其利的初衷,更會讓數位標章成為無法由程式輕易判讀的雞肋。

或許是終於有人正視這個潛在的問題,再加上有些檔案格式,例如純文字 (.TXT) 檔,根本不可能嵌入後設資料,於是目前在 CC 開發者圍紀 http://wiki.creativecommons.org/Developer 上,開始有改以額外的檔案來做為詮釋資料的作法,例如 foo.svg 就以 foo.rdf 來描述其授權資訊的後設資料。在可見的未來,這種作法一定也會遇到問題;例如說同時有 foo.svg 和 foo.eps 的情況,就很難一眼看出到底 foo.rdf 是在描述哪一個檔案(或者是兩者一起描述)。或許應該比照 GnuPG 數位簽章檔的那種作法,將副檔名附加在原有的副檔名後,而非取而代之,纔是比較好的作法;如此我們就可以輕易明白 foo.svg.rdf 是在描述 foo.svg 而 foo.eps.rdf 則是在描述 foo.eps 。

一旦採用這種作法,就可以應付下一個需求:後設資料的後設資料。在創用 CC 計畫與教育部的合作案中,涉及了協力下游廠商與主計畫之間的後設資料交換,從圖書館學的角度觀之也就是書目資訊,那麼這些後設資料本身的著作權又歸屬何方?可以被如何的使用?如此討論下去,勢必要再以後設資料來描述後設資料,用前述的作法也就是以 foo.svg.rdf.rdf 來描述 foo.svg.rdf 了。這種窘境其實也說明了數位世界的不完備:描述內容的後設資訊本身也會成為內容,因此無論如何都不可能自給自足地用後設資料來描述數位世界中一切的內容。

僅是由單純的數位檔案觀之,就可以衍生出這些恐怕是 Lessig 本人始料未及的狀況。然而數位世界又不單是如此而已,許多新的科技正在改變這個世界,例如影音串流 (streaming) 就早已改變了內容一定要附著於檔案的情況;就算每個可以被用來播放的數位內容都已經加上了 CC 授權的後設資料,但是對串流播放來說這些資訊卻非永遠能夠即時表達出來的。即便日後出現了共通的協定,將這些後設資訊封裝進影音串流的一個子頻道中,播放串流的數位廣播 (Digital Audio Broadcasting, DAB) 播放器最終要如何表達這些資訊,就又會是另一個問題的開端。

創用 CC 授權的法律條文已是白紙黑字,使用的普及也逐漸到了可以開始來談規模經濟,唯獨後設資料的實際採行幾乎可以說仍是一篇荒蕪。我們期待更多的有志之士投身於此,否則這方面的匱乏恐怕將成為日後 CC 運動的潛在羈絆。

(+) 於 所發表 | 顯示版本變更: 1.4 |
[創用 CC 授權條款]
從後設資料看 CC〉由 Jedi 製作,所有內容如無特別聲明,一律以創用 CC 姓名標示 3.0 台灣版授權條款釋出。
相關文章:
歷史上的今天:
迴響
[ 1 : 靜態鏈結 ]

文中的前段的「這些檔案格式的後設資料」是指 metadata 之類的對吧,第一次聽過可以這樣稱呼它的,還是說這已經是通俗稱呼?

由 Drake 發表於 May 16, 2006 07:49 PM
[ 2 : 靜態鏈結 ]

「創用 CC 授權的法律條文已是黑底白字」
不小心瞄到的,原來黑底白字比較 robust 呀 XD~

由 Drake 發表於 May 16, 2006 07:53 PM
[ 3 : 靜態鏈結 ]

後設資料,或詮釋資料,都是 metadata 的慣用翻譯了。無論好或不好,都已經是慣用了。

黑底白字顯然是寫錯了(笑),或者是當時不知道在想什麼……

Jedi 發表於 May 16, 2006 08:06 PM
[ 4 : 靜態鏈結 ]

我想到一個問題,就是詮釋資料有著作權問題嗎?如果以圖書的編目資料而言,基本上可以區分為「記述編目」與「主題編目」兩類。記述編目為描述圖書資料外表可得的資料項目,如書名、作者、長寬高等;這些資料為不具創作性之事實性資料,並不受著作權的精神所保護。主題編目雖然分類需要用到人的智慧,但是並不必然具備「獨創性」。

如果以「編輯著作」的觀點來看詮釋資料的著作權問題,能受到著作權保護的應是詮釋資料的規劃與編排上。技術上,我認為可能保護的標的會是像xml schema或是特定的分類法架構,而非個別的詮釋資料。因此應該不會有"foo.svg.rdf.rdf" 這種著作權上無限循環的問題。

xxc 發表於 May 22, 2006 09:07 PM
[ 5 : 靜態鏈結 ]

我本來也以為沒有,不過某部計中的人,跟某位圖書館學背景的老闆都堅持有,所以啦,妳也知道,我不是律師。

另,想一個簡單的問題,例如妳的詮釋資料中同時包含了像是「評分」這種東西呢?

Jedi 發表於 May 22, 2006 09:13 PM
[ 6 : 靜態鏈結 ]

我的想法是,就算在詮釋資料(以書目資料為例)中,編目者把這本書分類為「011.11 版權/著作權」,也很難主張這個「分類工作結果」具有可以為著作權保障的「創作性」。因為如果這個分類作結果真的十分獨創,大概也沒有人能用這個分類詞當成檢索的工具。

評分我想也是類似的情形,如果我將此資料評分為B+,我也沒有辦法禁止其他人也把這份資料也一樣評成B+,特別是,如果大家都使用相同的評分量表在作評分的工作。如果大家使用同樣的量表還會評成不一樣具有「創作性」的分數,那麼這份量表的「信度」可能大有問題。

我認為著作權保障的是創作工作,並非所有的勞力工作都在保障範圍內。我想引用著作權法第七條「就資料之選擇及編排具有創作性者為編輯著作,以獨立之著作保護之。」以上的兩種資訊工作(分類、評分),是否能屬於「創作」,應該是決定受不受著作權保護的關鍵。

然而,像是評分的「量表」,或是「分類法」本身,都屬於創作,能受到著作權的保護,這方面並無疑問。詮釋資料的規劃與結構,如schema,應該也是可以受到著作權保護的創作標的。

不過,我也同樣的不是律師,只是就所知道的一些著作權知識,討論看看。

xxc 發表於 May 23, 2006 05:03 PM
給我迴響吧!
個人資訊








是否記住個人資訊?



請依上圖輸入檢核碼:
迴響





Jedi.org: 部落格 | Weblog | 三太子 | 討論 | MTBook | 網頁親和力 | 深入親和力 | 簡報原力:AV | 履歷 | + | @ | Flickr | Lytro | tumblr | NSFW