[敲打鍵盤] 工欲善其事──談教育部國語辭典(下)

這一篇是我給聯合新聞網數位資訊的文章,於 2008/03/07 刊登在 http://mag.udn.com/mag/digital/storypage.jsp?f_MAIN_ID=315&f_SUB_ID=2927&f_ART_ID=113341 。請注意,這一篇文章並不授權各位讀者任意作為商業使用。

另,這一篇文章刊出後不久,教育部的各個網路辭典終於都有了各自的網址 (Domain Name),不知道是單純的巧合而已,還是本文的批評多少發揮了實際的效用:

工欲善其事──談教育部國語辭典(下)

前一回我們聊了字典的兩種用途,以及教育部國語辭典適用的情境,然後呢?

身為資訊時代的人民,不得不說,教育部國語辭典其實並不好用。這個「不好用」倒不是在嫌網頁查詢介面如何如何,而是附在教育部國語辭典上的羈絆太多,限制也太多,讓這個原本立意良善、內容著實珍貴的計畫成果,難以靈活調用。

為什麼這麼說呢?首先,教育部國語辭典的各個版本(修訂本、簡編本、小字典)以及其他相關的幾部辭典、字典(成語典、異體字字典)的網站,多年來一律祇有提供 IP 地址,而沒有提供易記的網址。這讓人十分費解,因為若沒有易記的網址,則教育部端的伺服器若變更了 IP 地址,使用者將難以得知,也就沒辦法繼續使用這些字、辭典了。

可是當我們進一步檢視教育部的辭典網站,不由得開始懷疑上述的做法並非疏忽,而是刻意為之。因為在教育部的網站上,有個「連結授權」的說明,根據那段說明,教育部辭典網站的網址(就算是那個 IP 地址而已)本身,就不隨便讓別人使用──只有學術研究、教育推廣且非商業性的網站,纔有資格在自己的網站上,放入連往教育部辭典網站的超連結,而且放置超連結之前還得先填寫申請書,向教育部申請。

這樣的規定已經超出了智慧財產權所保護的範圍。雖然教育部本身宣稱這是基於智慧財產權保護所做的規定,但是真要落實這樣的做法,將危害到普羅大眾合理使用的權利。別的不說,光是穀歌及雅虎等搜尋引擎,就不能把辭典網站的連結放進搜尋結果了,至於在 Firefox 內自訂國語辭典搜尋引擎,則更是違反教育部的連結授權方式;如果這真的是教育部的目的,那麼顯然教育部並不希望這些辭典網站的存在成為眾所周知的事,這也就不難理解為什麼這些網站僅有 IP 地址而無易記網址了──任何時候教育部都可以把這些辭典網站搬到未知的 IP 地址,僅提供特權人士使用。

光是網址與超連結就這麼麻煩了,內容的使用更是讓人頭大。

雖然教育部的各項辭典網站,都是用納稅人的血汗錢所做成的,但是其內容授權的規範更比超連結的使用還要嚴格,民眾極難取得;除了同樣限制學術研究、教育推廣且非商業性之目的纔有申請資格,也必須填具申請書外,同時還得先撰寫資料檔案使用的計畫書,一併提出獲准之後,方能取得資料檔案。

對於一般使用者來說,如果祇是想離線查詢,又能怎麼辦呢?目前唯一合法且合於教育部規定的方法,是購買光碟版的辭典,但是光碟版的資料比網頁版的要少且舊,更糟糕的是查詢的結果還無法以數位方式複製到其他應用程式中(也就是說,沒辦法用滑鼠右鍵選單或鍵盤快速鍵,選取查詢結果後複製到視窗剪貼簿,再貼到其他文字編輯軟體如 Word 或 UltraEdit 等),查詢程式也祇能用於視窗平台,對於 Mac 或 FreeBSD、Linux 等其他作業系統,則全無支援。

如果有讀者還沒有注意到,這樣的設計其實就是數位權利管理 (DRM) 的結果:用種種數位技術,限制資料內容的運用權利;購買光碟的人祇有買到「在視窗平台查詢」的權利,而不是完整的「用任何方式查詢及利用查詢結果」的權利。如果你覺得這些限制都還勉強可以接受,而想買一張光碟版辭典,很抱歉,目前這個光碟已經賣完了,再版之日遙遙無期。

有些對資訊技術比較瞭解的讀者,可能已經知道能夠自己撰寫程式腳本,直接到教育部國語辭典的網站上,將辭典內容一筆筆地取回,然後拿來離線使用或者是轉換成其他格式,搭配各種開放格式或跨平台的字典軟體使用。但是這樣的做法其實是存有爭議的──違背了教育部明示的授權規範,因為使用者既沒有準備計畫書,更沒有書面提出申請;在不顯著增加教育部伺服器負擔的前提下,或許還可以視為著作權法保障的合理使用,不過卻也祇能自己默默地用,不能提供他人這樣的服務,也不能教導其他人實際的做法,否則將違反著作權法(來自美國數位千禧著作權法案 DMCA 的條款──著作權法第八十之二條)。

繞了這麼一大圈,可別忘了,想使用這些內容的是人民,而製作這些內容的資金來源卻也還是人民。運用公眾資源所完成的成果,卻刻意使人民難以取得,這是筆者要再三批評的缺失。

辭典的編撰、維護固然是一件低報酬的苦差事,但是都已經是 2008 年了,許多事都有更好的做法,以開放取代限制,以鼓勵取代恫嚇;倘若教育部國語辭典在內容上能夠用更開放的方式授權給全民使用,提供更靈活有彈性的程式介面(API)供人們接駁到各自撰寫的程式中,或者如普林斯頓大學認知科學研究室對著名的 WordNet 資料庫授權的方式一樣,在不具名、不背書、不擔保的前提下,讓軟體廠商樂於開發更好用的查詢介面以獲利,提供在各種不同情境、不同平台上的查詢工具,又或者甚至可以針對每一個字或每一組辭來讓民眾予以討論,直接在網頁介面上顯示內容修改沿革等資訊……這些方式都可以讓這些資料活起來,而且對所有的民眾來說都將更有助益。

可惜的是,這麼大的改變勢必會造成許多公務員的負擔,在多一事不如少一事的陋習中,教育部國語辭典的維護及運用進展可謂牛步。也許有朝一日,我們得發動「一人一信‧開放教育部辭典」運動,纔能讓人們用到更好用的辭典;在那之前,我們仍然祇能將就著用目前這個「有總比沒有好」的線上辭典,一邊羨慕鄰近國家如日本在這方面的資訊開放吧。

jedi.org: