March 31, 2008

[敲打鍵盤]工欲善其事──談教育部國語辭典(下)

這一篇是我給聯合新聞網數位資訊的文章,於 2008/03/07 刊登在 http://mag.udn.com/mag/digital/storypage.jsp?f_MAIN_ID=315&f_SUB_ID=2927&f_ART_ID=113341 。請注意,這一篇文章並不授權各位讀者任意作為商業使用。

另,這一篇文章刊出後不久,教育部的各個網路辭典終於都有了各自的網址 (Domain Name),不知道是單純的巧合而已,還是本文的批評多少發揮了實際的效用:

工欲善其事──談教育部國語辭典(下)

前一回我們聊了字典的兩種用途,以及教育部國語辭典適用的情境,然後呢?

身為資訊時代的人民,不得不說,教育部國語辭典其實並不好用。這個「不好用」倒不是在嫌網頁查詢介面如何如何,而是附在教育部國語辭典上的羈絆太多,限制也太多,讓這個原本立意良善、內容著實珍貴的計畫成果,難以靈活調用。

為什麼這麼說呢?首先,教育部國語辭典的各個版本(修訂本、簡編本、小字典)以及其他相關的幾部辭典、字典(成語典、異體字字典)的網站,多年來一律祇有提供 IP 地址,而沒有提供易記的網址。這讓人十分費解,因為若沒有易記的網址,則教育部端的伺服器若變更了 IP 地址,使用者將難以得知,也就沒辦法繼續使用這些字、辭典了。

可是當我們進一步檢視教育部的辭典網站,不由得開始懷疑上述的做法並非疏忽,而是刻意為之。因為在教育部的網站上,有個「連結授權」的說明,根據那段說明,教育部辭典網站的網址(就算是那個 IP 地址而已)本身,就不隨便讓別人使用──只有學術研究、教育推廣且非商業性的網站,纔有資格在自己的網站上,放入連往教育部辭典網站的超連結,而且放置超連結之前還得先填寫申請書,向教育部申請。

這樣的規定已經超出了智慧財產權所保護的範圍。雖然教育部本身宣稱這是基於智慧財產權保護所做的規定,但是真要落實這樣的做法,將危害到普羅大眾合理使用的權利。別的不說,光是穀歌及雅虎等搜尋引擎,就不能把辭典網站的連結放進搜尋結果了,至於在 Firefox 內自訂國語辭典搜尋引擎,則更是違反教育部的連結授權方式;如果這真的是教育部的目的,那麼顯然教育部並不希望這些辭典網站的存在成為眾所周知的事,這也就不難理解為什麼這些網站僅有 IP 地址而無易記網址了──任何時候教育部都可以把這些辭典網站搬到未知的 IP 地址,僅提供特權人士使用。

光是網址與超連結就這麼麻煩了,內容的使用更是讓人頭大。

雖然教育部的各項辭典網站,都是用納稅人的血汗錢所做成的,但是其內容授權的規範更比超連結的使用還要嚴格,民眾極難取得;除了同樣限制學術研究、教育推廣且非商業性之目的纔有申請資格,也必須填具申請書外,同時還得先撰寫資料檔案使用的計畫書,一併提出獲准之後,方能取得資料檔案。

對於一般使用者來說,如果祇是想離線查詢,又能怎麼辦呢?目前唯一合法且合於教育部規定的方法,是購買光碟版的辭典,但是光碟版的資料比網頁版的要少且舊,更糟糕的是查詢的結果還無法以數位方式複製到其他應用程式中(也就是說,沒辦法用滑鼠右鍵選單或鍵盤快速鍵,選取查詢結果後複製到視窗剪貼簿,再貼到其他文字編輯軟體如 Word 或 UltraEdit 等),查詢程式也祇能用於視窗平台,對於 Mac 或 FreeBSD、Linux 等其他作業系統,則全無支援。

如果有讀者還沒有注意到,這樣的設計其實就是數位權利管理 (DRM) 的結果:用種種數位技術,限制資料內容的運用權利;購買光碟的人祇有買到「在視窗平台查詢」的權利,而不是完整的「用任何方式查詢及利用查詢結果」的權利。如果你覺得這些限制都還勉強可以接受,而想買一張光碟版辭典,很抱歉,目前這個光碟已經賣完了,再版之日遙遙無期。

有些對資訊技術比較瞭解的讀者,可能已經知道能夠自己撰寫程式腳本,直接到教育部國語辭典的網站上,將辭典內容一筆筆地取回,然後拿來離線使用或者是轉換成其他格式,搭配各種開放格式或跨平台的字典軟體使用。但是這樣的做法其實是存有爭議的──違背了教育部明示的授權規範,因為使用者既沒有準備計畫書,更沒有書面提出申請;在不顯著增加教育部伺服器負擔的前提下,或許還可以視為著作權法保障的合理使用,不過卻也祇能自己默默地用,不能提供他人這樣的服務,也不能教導其他人實際的做法,否則將違反著作權法(來自美國數位千禧著作權法案 DMCA 的條款──著作權法第八十之二條)。

繞了這麼一大圈,可別忘了,想使用這些內容的是人民,而製作這些內容的資金來源卻也還是人民。運用公眾資源所完成的成果,卻刻意使人民難以取得,這是筆者要再三批評的缺失。

辭典的編撰、維護固然是一件低報酬的苦差事,但是都已經是 2008 年了,許多事都有更好的做法,以開放取代限制,以鼓勵取代恫嚇;倘若教育部國語辭典在內容上能夠用更開放的方式授權給全民使用,提供更靈活有彈性的程式介面(API)供人們接駁到各自撰寫的程式中,或者如普林斯頓大學認知科學研究室對著名的 WordNet 資料庫授權的方式一樣,在不具名、不背書、不擔保的前提下,讓軟體廠商樂於開發更好用的查詢介面以獲利,提供在各種不同情境、不同平台上的查詢工具,又或者甚至可以針對每一個字或每一組辭來讓民眾予以討論,直接在網頁介面上顯示內容修改沿革等資訊……這些方式都可以讓這些資料活起來,而且對所有的民眾來說都將更有助益。

可惜的是,這麼大的改變勢必會造成許多公務員的負擔,在多一事不如少一事的陋習中,教育部國語辭典的維護及運用進展可謂牛步。也許有朝一日,我們得發動「一人一信‧開放教育部辭典」運動,纔能讓人們用到更好用的辭典;在那之前,我們仍然祇能將就著用目前這個「有總比沒有好」的線上辭典,一邊羨慕鄰近國家如日本在這方面的資訊開放吧。

所發表
[創用 CC 授權條款]
工欲善其事──談教育部國語辭典(下)〉由 Jedi 製作,所有內容如無特別聲明,一律以創用 CC 姓名標示 3.0 台灣版授權條款釋出。
相關文章:
歷史上的今天:
迴響
[ 1 : 靜態鏈結 ]

自從改版後不久便發生海外用戶不能登入http://dict.revised.moe.edu.tw/ 的狀態,好一段日子了。

去信通知卻只有官樣答覆而無實際改善行動。難道只歡迎台灣的人使用嗎?有點不快呢。

小奧 發表於 March 31, 2008 07:13 PM
[ 2 : 靜態鏈結 ]

我是國語辭典的重度使用者,讀來心有戚戚焉...
我寫了一篇Blog,其中容我引用了您的大作。
http://blog.darkthread.net/blogs/darkthreadtw/archive/2008/04/01/expecting-an-open-chinese-dictionary.aspx
事實上,我已經身體力行,馬上提筆寫了信給我查得到Email的教育委員會立委,希望能產生一些迴響。

Darkthread 發表於 April 1, 2008 12:21 AM
[ 3 : 靜態鏈結 ]

即知即行的人,最值得欽佩了!

Jedi 發表於 April 1, 2008 01:40 AM
[ 4 : 靜態鏈結 ]

文中提及「不過卻也祇能自己默默地用,不能提供他人這樣的服務,也不能教導其他人實際的做法,否則將違反著作權法」, 這是來自於 DMCA 的 circumvention 預防禁制架構。但公家單位的著作, 其實在《著作權法》第五十條中另有規定:

 「以中央或地方機關或公法人名義公開發表之著作,在合理範圍內,得重製或公開播送。」

所以政府著作不適用 circumvention 禁制之規定, 仍得重製、甚至播送, 問題是出在「合理範圍」的意義。至於「(來自美國數位千禧著作權法案 DMCA 的條款──著作權法第八十之二條)」, 不解其中「著作權法第八十之二條」何所指?與 DMCA 的關係又是?

由於此文談的主題即辭典, 故爾提出文中一二疑字, 此乃「軌範性」思考所生的正字桎梏並需要也:剛/鋼彈(後為通譯)、蠻/滿(參教育部辭典[辨似])、一相/廂情願(通用)、谷/穀歌(專有名詞簡繁轉換必要性?)。若基於「描述性」或「纂蒐性」不廢芻蕘之意, 卻又明顯是可被取錄的。這僅是對於上篇旨意所做的一個就地對照, 別無他意。

維克拉倫 發表於 April 1, 2008 07:39 AM
[ 5 : 靜態鏈結 ]

剛/鋼彈可以算是用錯字因為我對它並不著迷,沒特別留意通譯字是哪一個。「穀歌」為尊重他國公司命名精神而做的翻譯,李怡志也是這麼用。另諸多看似與慣用字略不同的選字,則為簽章(浮水印?)的一部分。

Jedi 發表於 April 1, 2008 10:34 AM
[ 6 : 靜態鏈結 ]

嗯, 將這當作 text-type 的浮水印, 不失為 low-tech 的一種應用。 :)

在曾看過的眾多關於電腦、網路論述的個人網站中, 貴部落格對於用字遣詞的要求是有相當水準的, 所以我挑的都不算錯字, 只是讀了前篇有關於兩種辭典彙編的方式後, 覺得當下即可就該文選出一些字詞作通用寬嚴的比較而已, just trivia。題外話, 鋼彈與絕地武士手持的基本武裝都是 beam saber 呢, 而前者當然是受後者影響的。

至於與 DMCA 的關聯性, 莫非是指製版權嗎?不過那是對於無著作財產權情況下對於編排形式創作的一種保障, 與 DRM 的 circumvention 禁制規定看來又有所不同...

維克拉倫 發表於 April 3, 2008 06:38 AM
[ 7 : 靜態鏈結 ]

在五年之後,這篇文章提到的情況,藉由「工欲事其善,必先棄其利」的 CC0 公眾領域聲明,以及《著作權法》第五十條所揭櫫的合理使用精神,在 https://moedict.tw/ 與 http://3du.tw/ 得到了開放界面的實現。

發表於 February 27, 2013 05:20 PM
給我迴響吧!
個人資訊








是否記住個人資訊?



請依上圖輸入檢核碼:
迴響





Jedi.org: 部落格 | Weblog | 三太子 | 討論 | 網頁親和力 | 深入親和力 | 簡報原力:AV | 履歷 | @ | Flickr | tumblr | NSFW