語言典藏計畫

計畫主持人:齊莉莎

執行單位:中研院語言所

計畫介紹:

「語言典藏」屬於國科會TELDAP機構計畫下分項主題計畫之一。第一期計畫為:2002~2006,現已進入第二期計畫(2007~2012),另外在第一期計畫開始的前一年(也就是2001)先執行實驗研究計畫。此計畫之建置目的在於蒐集和保存語言多樣性,分成漢語和臺灣南島語典藏。漢語典藏又細分為四個子計畫包括:「閩客語典藏」、「臺灣國語口音之社會分佈典藏」、「上古漢語文獻標記語料庫」、「先秦甲骨金文簡牘語料庫」。「臺灣南島語言典藏」的主要目的為建立一個數位圖書館,期能蒐集、保存、編輯及透過網路散播南島語語言資源。 自從2002年研究結果都放在網路上,方便查詢。每個子計畫所建立的網站多年來已變成漢語和南島語關鍵的研究工具。

入口網站介紹:

語言典藏計畫是以「語言」為數位化典藏對象,九六年開始正式邁入第二期;二期計畫包括下列五項子計畫:1.「閩客語典藏計畫」、2.「臺灣南島語數位典藏計畫」、3.「臺灣國語口音之社會分佈典藏計畫」、4.「上古漢語文獻標記語料庫」、5.「先秦甲骨金文簡牘語料庫計畫」。自九一年起,語言典藏計畫成果皆陸續開放網路檢索,已成為漢語語言學研究者的基本參考工具。九六年開始邁入第二期,總目標在致力維護「語言多樣性」,本土典藏與國際合作則為二期計畫的兩大重點。

http://languagearchives.sinica.edu.tw/

特色典藏:

「語言典藏」計畫是以「語言」為數位化典藏對象,包含「臺灣南島語典藏」及「漢語典藏與典藏架構」兩部份;典藏品型態包含語料文獻、聲音、多媒體語音。

「漢語典藏與典藏架構」的計畫目標,是針對時間軸上的歷代詞彙進行典藏,包括:

1.建立先秦金文簡牘詞彙資料庫,對青銅器銘文和簡牘文字作精確的標誌與分析。
2.建立近代漢語標記語料庫,將近代漢語時期的文獻詞彙進行詞類分析,架構成有系統的知識庫。
3.擴大建立現代漢語平衡語料庫,務求語料能真正呈現時代語言中的多面向內容;並構建現代漢語句結構資料庫,使語料能充份運用於資訊檢索、擷取、 自動問答、摘要等典藏處理應用上的附加價值。
4.新世紀語料庫-多媒體的語言呈現與典藏,記錄當代臺灣漢語真正口語使用的情形,再就多元化的主題設計而產生的時間、地點、人物、事物的語言討 論內容數位化,並予以後設資料的典藏與保存。
5.建立空間軸上的漢語方言-閩南語典藏,從歷史語言與分佈變遷二個角度,結合文獻與生活語言,進行標誌與分析。目標之一為構建閩南語文獻標記語 料庫;目標之二為記錄語言分佈變遷的地理資訊系統,以閩客雜居的新竹縣新豐鄉為對象,調查居民用語變化,分析記錄閩客用語交互之影響。

「臺灣南島語典藏」目的在保存瀕臨滅絕的臺灣南島語言。臺灣原住民語言屬於一個分佈很廣,語言現象又極為豐富的語族,稱為「南島語族」;南島語族現今分佈遍及整個太平洋及印度洋。臺灣的南島語言呈現極大的變異,其中有很多仍未被探索。大多數的臺灣南島語言仍未有文字記載,幾乎面臨消失的命運,一旦語言或方言的使用者不復存在,這個語言或方言也就跟著消失,毫無記錄可循。因此目前除了以各種方式延續語言的生命外,更實際的作法即是蒐集和保存現有的語料。本計畫建立「臺灣南島語數位典藏」的目的之一為蒐集、彙整、編輯、流通這些語料並利用網際網路(Internet)散播;除了聲音的數位化與記音保存,分析語言結構、標記、中英文翻譯也是重要的執行工作之一。預計典藏的語言有十一種:魯凱語、雅美語、鄒語、賽夏語、泰雅語、排灣語、布農語、阿美語、卑南語、卡那卡那富語、巴宰語。

卑南語巫師的祭文

卑南族原為一個以男性巫師為主的社會,至二十世紀初變成一個女性巫師的社會,家庭功能為主的祭典由女性負責,部落祭典則是由男性負責。臺灣南島語數位典藏所呈現卑南語巫師的祭文共有31個祭典,可分為普通/個人及特殊/大家共同參兩類。

祭典文的內容除了請求(例如:在開始以機器縫製巫師袋子之前要先告知神靈)和感恩外,所呈現的內容針對不同問題提出,比如:生病、死亡等。這些祭典的語言呈現跟一般生活中所使用的語言不完全相同,一般卑南族人聽不懂。過去成為巫師的過程相當辛苦,因為巫師在社會中的功能和責任很大。如今如同其他原住民族所面臨的文化傳承問題,卑南族沒有年輕人願意學習巫術,部落傳統祭祀文化即將面臨消逝的處境,而典藏的特色在於翻譯這些祭典並且加以語言分析,使這個典藏的語料更加珍貴。