從後設資料看 CC
這一篇是我給自由軟體鑄造場電子報的稿件,刊登於第五十七期。從這一篇起,我在自由鑄造場電子報的專欄名稱正式定名為「開放原力」,請大家多多捧場指教。
從後設資料看 CC
熟悉 Creative Commons (CC) 的朋友應該都知道,任何一種創用 CC 授權條款都有三種表達方式:法律條款、數位標籤以及授權標章;這三種授權條款的表達方式彼此相輔相成,共同構成了創用 CC 的運行世界。這是整個 CC 的精要所在,也是 CC 異於其他任何公眾授權 (Pubilc Licenses) 之處。
之所以 CC 會有這樣的設計,其實跟 CC 發起人之一 Lawrence Lessig 的科技法背景是脫不了干係的。 Lessig 身為律師,在他所建構的 CC 世界觀中,乃是個法、理、情兼重的世界:「法」指的是法律條款,是 CC 授權的核心,也是最嚴謹、最後的一道防線;「理」指的是數位標籤,是全然理智、講邏輯的數位世界中,讓電腦程式也能精確判讀的後設資料;而「情」指的是授權標章,是為了讓任何人都可以輕易明白授權條款的概要而存在的。
雖然說這三者並重,但是法律條款無疑地具有絕對的效力,而授權標章卻完全沒有任何法律價值。法律條款純為法律目的而存在,完全不顧及一般人是否看得懂;授權標章則純為一般人而做,因此在措辭、概念傳遞上,完全不具法律文件的精確性。那麼,數位標籤呢?
數位標籤是 CC 授權條款極為重要的一環,卻也是最常被忽略的一環,因為在此刻的 CC 世界中,參與最為活躍的不外乎律師和藝人,這些人最為熟悉的乃是法律條款及授權標章;而對於資訊技術最為熟悉的程式設計師與工程師們來說, CC 的參與卻還有相當大的發展空間。在 Lessig 所設想的「理想的數位世界」中,一切的程式碼猶如現實世界中的法律條文一般,規範左右著數位內容與數位身分,然而要達到這個境界前,勢必要先將現實世界中抽象的「關係」給具體化描述出來;用來描述這些內容的,正是後設資料。
換而言之, CC 世界中的數位標籤,仰賴著各種數位內容皆有完備的後設資料格式纔得以落實。 CC 發展的頭幾年,若干原本就內嵌後設資料的檔案格式,很快地也跟著得以嵌入 CC 授權的後設資料。例如 HTML/XHTML 、 RDF 、 RSS 、 SMIL 、 XMP (PSD, PDF) 、 MP3 、 Ogg Vorbis 等,這些檔案格式的後設資料要如何加入 CC 授權的資訊,均已經可以從創用 CC 網站 http://creativecommons.org.tw/static/technology 查得。
可是當今的數位世界距離 Lessig 理想中的樣子還非常遙遠。當我們回過頭去檢視這些嵌入於內容的 CC 授權資訊時,馬上能發現有些實做顯然是囿於各種規格的先天障礙,而採行的權衡之策;例如 XHTML 或 SMIL 所嵌入的 CC 授權資訊,本質上是 RDF 格式的後設資料,有著對各種授權要素(例如:允許衍生著作,要求相同方式分享等)的等價表示,但是像 MP3 及 Ogg Vorbis 內,卻祇能運用 ID3 標籤或 Ogg 註解欄位來存放授權標章的網址。這兩種嵌入後設資料的方法,實際嵌入的資訊詳細程度有著不小的差距,自然而然地就會帶來一些迷惘:如果有授權標章的網址就夠了的話,何必要逐一著錄授權要素呢?如果需要著錄授權要素纔算完整的話,那麼僅標示授權標章網址的作法是否不夠強猛有力 (robust) 呢?
前面提過,法律條款祇管法律的需求,授權標章祇管普羅大眾的需求,但是數位標籤在實做上如果僅提供了授權標章網址,一方面會增加授權標章的負擔,另一方面則會減弱數位標籤的效力,不但有違三種表現方式各司其職、互蒙其利的初衷,更會讓數位標章成為無法由程式輕易判讀的雞肋。
或許是終於有人正視這個潛在的問題,再加上有些檔案格式,例如純文字 (.TXT) 檔,根本不可能嵌入後設資料,於是目前在 CC 開發者圍紀 http://wiki.creativecommons.org/Developer 上,開始有改以額外的檔案來做為詮釋資料的作法,例如 foo.svg 就以 foo.rdf 來描述其授權資訊的後設資料。在可見的未來,這種作法一定也會遇到問題;例如說同時有 foo.svg 和 foo.eps 的情況,就很難一眼看出到底 foo.rdf 是在描述哪一個檔案(或者是兩者一起描述)。或許應該比照 GnuPG 數位簽章檔的那種作法,將副檔名附加在原有的副檔名後,而非取而代之,纔是比較好的作法;如此我們就可以輕易明白 foo.svg.rdf 是在描述 foo.svg 而 foo.eps.rdf 則是在描述 foo.eps 。
一旦採用這種作法,就可以應付下一個需求:後設資料的後設資料。在創用 CC 計畫與教育部的合作案中,涉及了協力下游廠商與主計畫之間的後設資料交換,從圖書館學的角度觀之也就是書目資訊,那麼這些後設資料本身的著作權又歸屬何方?可以被如何的使用?如此討論下去,勢必要再以後設資料來描述後設資料,用前述的作法也就是以 foo.svg.rdf.rdf 來描述 foo.svg.rdf 了。這種窘境其實也說明了數位世界的不完備:描述內容的後設資訊本身也會成為內容,因此無論如何都不可能自給自足地用後設資料來描述數位世界中一切的內容。
僅是由單純的數位檔案觀之,就可以衍生出這些恐怕是 Lessig 本人始料未及的狀況。然而數位世界又不單是如此而已,許多新的科技正在改變這個世界,例如影音串流 (streaming) 就早已改變了內容一定要附著於檔案的情況;就算每個可以被用來播放的數位內容都已經加上了 CC 授權的後設資料,但是對串流播放來說這些資訊卻非永遠能夠即時表達出來的。即便日後出現了共通的協定,將這些後設資訊封裝進影音串流的一個子頻道中,播放串流的數位廣播 (Digital Audio Broadcasting, DAB) 播放器最終要如何表達這些資訊,就又會是另一個問題的開端。
創用 CC 授權的法律條文已是白紙黑字,使用的普及也逐漸到了可以開始來談規模經濟,唯獨後設資料的實際採行幾乎可以說仍是一篇荒蕪。我們期待更多的有志之士投身於此,否則這方面的匱乏恐怕將成為日後 CC 運動的潛在羈絆。