【文/曾筱茜 (國立中央大學客家語文研究所研二生)】
能將語言像結構分子般分析,能同電算機器般運算,從而獲數據得結果的語文教研推手,是對鄭錦全教授的深刻印象。這學年歷經所上安排的多場演講,所見演講者數十位,對於鄭錦全教授的印象及體認,便為能將語言數位化、科學化落實於教與學的長期經營者。
鄭錦全教授現任中央研究院語言學研究所院士研究員,以及台灣師範大學華語文教學研究所講座教授。鄭教授多年以來多將心力置於語言資料庫的建構,將語言數位化典藏,提供更多元的學術資源及參考程式,更不忘將方言的推廣及精進相輔相成地進行著。於過往著作亦可發現多半以致力於語言科學化結合數位典藏為主要,例如於「語言政策的多元文化思考」研討會中發表的〈中央研究院語言典藏〉,以及「全球華語文數位教與學資源中心」、「全球華文網路教育」的研討會等等,多著力在語言與數位科技的結合應用。
例如,近年發表之〈台灣客家方言詞彙關係與語言活力〉此篇文章,主要內文在於探析:將客語能力認證中的基本初級詞庫內二千四百多條詞目做為數據基礎,並分別於台灣客家各方言:四縣、海陸、饒平、大埔、詔安等客話以及閩南語和國語所對應的詞語作一計算,且分為四類別的方言間詞彙相似度分析。並且,於最後將其計算之結果,作一語言活力的探討。此場演講及其文章論述,最大的獲得便為清楚質量數據化的語言圖表計算結果。然而,「語言(方言)和語言(方言)之間,是否具有一實際數據化的呈現方法?」便為文章及此場演講最為重要的動機及目的所在。若以一般固有形式操作的模式下,將所有詞彙條例列舉出,這種一般常以列舉來說明異同的方式,提供出的為一零散之概念、無法宏觀有效的表達其中。因此,倘若欲深入了解方言間詞彙的差異,需要一番具體性的比較,故如何解決此問題便是一大課題所在,須有一實際並實用的方法來呈現現象並解決問題。
然而,「列舉」是在學術驗證過程中,呈現現象的方法之一,進而將視其現象中的程度,便須整體全面性的共同比較分析之。語言學的研究,不能只用一些例子列舉即可輕易說明的,應設計一具體的「方法」,科學性的呈現其中。因而,其目的在於建立語言計算的方法,使其更為接近「事實」。以上便可呼應鄭錦全教授於此場演講及文章所論述的核心所在,換言之,便將數位資訊科技做一實際具體的工具與途徑,而「語言」視為主體檢視其中。
鄭錦全教授總讓我們所見,以簡潔的數位方法,計算出具體的方言關係,更使其了解並體認到數位結合的開發性與重要性。不論運用於語言典藏、語料庫的建立等,從人文社會科學的綜合觀點出發,致力於誤差偏誤認識的導正,希冀能以長遠的持續開發並使用其程式,達研究上更為多元深入的學術交流,將視為社會科學領域的「語言學」充分善用其中而永續發展。並道出「客家語言的傳承是台灣社會人士和學界所關注的問題,在閩南語和國語優勢環境下,須帶動年輕族群學習自己長輩的語言,增加語言的活力」,即便在現今社會體制中,客家方言吸收許多新詞彙,而沒有大量變動各方言間的詞彙相似關係,維持了方言的穩定發展,增加並培養其語言活力。