[廚餘瑣碎] CLAN and CHILDES

CHILDES 是兒童語料交換系統(Child Language Data Exchange System),其中謄寫的表示式稱做 CHAT ,而分析語料的軟體則是 CLAN

CLAN 顯然不是 GPL 的產物。

前一版的 CLAN 照慣例處理中文字有無限多的問題,包括最常見的「許」「成」衝碼。然後不知不覺間,它偷偷地改版了,並且好像解決了這個問題。

我其實覺得就一個軟體發展來說, CLAN 絕對不是好設計。為什麼呢?因為妳無法從任何文件當中得知它的版本演變、錯誤修正等資訊,事實上妳連妳現在手便使用的版本為何都無從得知。

呃,理論上要取得 CLAN 的源碼並非不可能,妳可以抓取 UNIX 版本的 CLAN ,就可以取得。(啊,我看到裡頭有 makefile.osx 呦)但是這份源碼是否能夠編譯成其他平台的呢?這我不知道。

另一方面,我找不到任何文件註明了 CLAN 的授權協議;通常這表示 CLAN 雖然至少提供了 UNIX 上的源碼,但並不遵從 GPL ,也就是說妳沒有權力擅自變更這些源碼的內容並且散佈─它不是自由軟體(Free Software)。

還記得我在前面提過的那個 bug 嗎?關於中文字衝碼的處理那個。我不知道除了透過郵遞論壇之外,還有甚麼辦法可以讓眾人一起參與這套軟體的開發與維護。最直接的影響就是會有一批人沒辦法正常的使用這套軟體,他們只能抱怨個老半天,然後禱告有一天奇蹟發生,某個錯誤就這麼被修好了。

噢,就更別提中文化(或更廣義地, l10n )了。


我會想到這個議題,主要是來自於這陣子我受命要建立起敝所甚麼某「國科會兒童聽語中心建立計畫」的成果發表網站;老闆們說「我們要建立一個資料庫,讓其他人可以用」。

但是他們(以及多數的學者)其實並不知道自由軟體、自由文件這種東西,他們的觀念完全受到「版權(copyright)」的根深蒂固,而不知道開放及自由的好處。

我一直在想,要如何才有辦法推動這類的事情發展?要如何讓大家知道,開放遠比封閉好?要到哪一天,人們才懂得集眾人之力,而不計較個人的短淺利益?

btw, 像是處理語料這種事情,我還以為拿 perl (而不是 C )來做會更適合?

jedi.org: