• 6530
撰文 / 文 / 李壬癸
圖 / 文 / 李壬癸

       太平洋跟印度洋中有很多島嶼,最大的島嶼是婆羅洲(Borneo),其次是在非洲東岸的馬達加斯加(Madagascar)。除了很小的島嶼不適合人居住以外,遍布於這兩大洋中的許多島嶼都有人居住。自從歐洲人於十五世紀末發現美洲大陸以來,就經常有人航行於歐、美兩大陸之間,他們也就有機會遇見各群島上的各種住民。後來他們陸續發現,原來他們所講的語言有不少相似之處,大概屬於同一個民族。臺灣島上的住民跟他們是否也同源,一直到十九世紀歐美人士才陸續舉出例證來說明他們跟菲律賓、馬來西亞應是同源。現在我們就管這個民族叫作南島民族(Austronesian language family)
中央研究院計算中心繪製的南島民族分布圖。北起臺灣,南至紐西蘭(不含澳洲),西至非洲馬達加斯加島
,東至智利復活島。〈南島民族分布圖〉,中央研究院計算中心繪製。圖片提供者:李壬癸

       南島民族北起臺灣,南至紐西蘭(不含澳洲),西至馬達加斯加,東至復活節島(Easter Island),總面積約佔全球的三分之二,絕大多數都是海洋地區,陸地佔很小的比例。總人口約四億,印尼人口就超過二億四千萬人,其次是菲律賓(八千八百萬),再其次是馬來西亞(二千四百萬)跟馬達加斯加人(一千八百萬),臺灣只有五十萬人。南島語言總數約一千二百種,臺灣約只有二十種,但其中有三分之一已經消失了。講馬來語(也叫作印尼語)的人數最多,大多數的南島語言人數並不多,人數最少的語種卻只剩下個位數會講。

請按此連結聲音檔。說明:張素玢採集的卑南族神父曾建次的口述歷史資料,描述其族語流失的情形。聲音檔:〈卑南族(知本部落)曾建次──語言與口傳歷史的流失〉,張素玢採集,年份:2009。聲音檔提供者:行政院原住民族委員會文化園區管理局。)
       臺灣南島語言在四百年前都還沒有任何文獻紀錄,直到荷蘭人於十七世紀(1624-1662)到臺灣來了以後,為了傳教才著手以族語編寫基督教材和詞典。鄭家王朝跟清代統治臺灣二百多年間(1662-1895),並沒有為這些語言留下多少資料。1895年,臺灣割讓給日本之後,日本學者才開始做有系統的調查研究小川尚義一手奠定了臺灣南島語言研究的基礎。50年代以後,才有我國的學者去做,包括李方桂院士跟董同龢教授,他們各有相關的著作出版,也都訓練了一些年輕的學者從事臺灣南島語言的調查研究。早幾年外國學者,如丹麥籍Søren Egerod,美國籍Raleigh Ferrell,日本籍土田滋等人,都有重要的貢獻。近四十年來,這種局面才逐漸改變為由我國學者扮演最主要的研究角色。本來都由中央研究院主導,近幾年來有些大學,如臺灣師範大學清華大學臺灣大學的相關系所,也有學者和研究生積極投入這一方面的調查研究工作,累積的成果也相當可觀。此外,行政院原住民族委員會近幾年來也在努力推動各種族語的維護和保存工作,包括編纂各種族語的詞典,有文字檔及語音檔在網站上陸續公開,開放一般民眾上網查詢。
       早在1930年代,日本語言學小川尚義就陸續發現臺灣南島語言保存了許多古語的特徵,這些特徵在臺灣地區以外的所有南島語言都消失了。他的重要發現後來於1935年出版的《原語による台湾高砂族伝説集》做了總語。1977年起,美國語言學者Robert Blust就主張臺灣南島語言最紛歧,後來有更多的學者研究,累積了更多的證據可以支持他這種看法。如今這兩種觀點可以說已成定論了。
       總之,在整個南島語系,臺灣南島語言具有這兩大特點:(一) 它們最紛歧,(二) 它們保存最多古語的特徵。語言愈紛歧,表示它們分化的年代愈久,因此語言最紛歧的地區就最有可能是這個民族的祖居地(homeland),也就是該民族的擴散中心。臺灣南島語言既然保存最多古語的特徵,要重建古南島語(proto Austronesian)及其早期的歷史,就必須使用臺灣南島語言的資料。國際南島語言學界大都支持以上這些主張。這是一百年來經過許多學者的共同努力,所得到的研究成果。所有居住在臺灣的人,都應該特別珍惜仍然存在我們這個寶島上這些珍貴的語言,然而它們卻都面臨消失的危機。
       有關臺灣南島語言的論著相當多,已出版的專書數十部,期刊論文數百篇(散見於國、內外各種期刊),詞典十二部,博士論文四十五篇,碩士論文一百二十篇(學位論文多在臺師大、清大、臺大完成)。國際期刊以Oceanic Linguistics為最重要,國內期刊以《語言暨語言學》期刊最重要;出版處國內以中研院為主,國外以澳洲國立大學的Pacific Linguistics為主
中央研究院計算中心繪製的臺灣南島民族分布圖
〈臺灣南島語分布圖〉,中央研究院計算中心繪製。圖片提供者:李壬癸

       「台灣南島語數位典藏」是國科會數位典藏國家型機構計畫下分項主題「語言典藏」的子計畫之一,整體建置作業之規劃暨主持人為齊莉莎女士。此計畫之建置目的在於建立一數位圖書館,期能蒐集、保存、編輯及透過網路散播語言資源,供使用者存取已錄製及記音的南島語。第一期計畫為:2002~2006,第二期計畫則為:2007~2012。
       「台灣南島語數位典藏」的建置已十年了,典藏內容分為語料庫、語言地理系統、臺灣南島語言學書目資料庫、網路詞典、網路語法等,最終目標為建立大多數臺灣南島語的語音、詞彙、單句和長篇語料,並加以中、英文翻譯
中央研究院語言所建置的「台灣南島語數位典藏」網站使用介面,語料庫的使
用者選擇文本後,即可檢視原文、翻譯及單字註解,還可以聆聽語音檔案。
〈台灣南島語數位典藏語料庫頁面〉。圖片提供者:中央研究院語言學研究所。

       目前有部分的系統尚未公開。所開放系統的應用上,我們建構了介面程式,讓使用者可以依語言、主題等參數來設定語料庫範圍,並做進一步的統計及比較研究。語料可從三方面進行檢索及搜尋關鍵詞,讓使用者從語料庫中找到任何出現的例證,並且了解其分布與功能,可查詢的語言包括:魯凱語、賽夏語、泰雅語、鄒語、阿美語、布農語、排灣語、卑南語、巴宰語、卡那卡那富語、西拉雅語雅美語。語料查詢也搭配有聲檔案,使得語言的記錄更趨完善。

【本文轉載自拓展臺灣數位典藏計畫數位島嶼.萬種風情網站 http://knowledge.teldap.tw/million/index.php

了解台灣典藏計畫