2025年3月26日在中國社會科學院民族學與人類學研究所召開了由徐世璇研究員擔任首席專家的國家社科基金綜合類重大招標項目“數(shù)位典藏理論探討和軟件平臺建設及其語言實踐研究”結項評審會。會議由中國社會科學院科研局項目處閆珺處長主持,來自高校的五位評審專家分別于線下線上參加了會議。民族學與人類學研究所黨委書記趙天曉、主持所務工作的丁賽副所長出席會議,參加會議的還有科研處王小霞處長、語言學科片各研究室主任及同仁和課題組成員,共20余人。
首先,課題主持人徐世璇研究員對課題執(zhí)行情況、課題特點、最終成果及其創(chuàng)新等做了全面匯報。子課題負責人于重重教授對計算機及AI技術在課題中的研究與應用作了專題陳述。課題組還簡要介紹和演示了典藏庫的線上形式、關于語言及其社會文化的影視片和由專用軟件Elan合成的多模態(tài)語料。
這一重大課題是一項跨學科、多專業(yè)的綜合性、原創(chuàng)性研究,課題的最終成果分別為一部30萬字左右的專著和一個三種語言的多模態(tài)語言典藏庫。專著對本世紀形成和發(fā)展起來的語言典藏這一新領域的實踐經驗、理論建構、方法創(chuàng)新進行全面的分析和論述,試圖以我國的語言特點和典藏實踐促進語言典藏理論和方法論的建設,推進相關研究的深入發(fā)展。多模態(tài)語言典藏庫建立在對土家語、呂蘇語、水語進行田野調查所獲取的全新語料的基礎上,以長篇自然話語為主體,對所有的音像數(shù)據(jù)進行國際音標記音、語法標注、漢語逐詞對譯和逐句意譯,并通過專用軟件將音頻、視頻和標注翻譯的文本進行三維合一,形成多層對應、同步顯示的多模態(tài)語言資料,力求盡可能真實地記錄原生態(tài)的自然語言。
評審專家仔細聽取了課題總結匯報,對課題最終成果進行了認真的審議,就相關問題進行了提問。五位專家對課題成果給予一致肯定和較高評價,認為專著對調查采錄原始語料和語言數(shù)據(jù)技術處理的理論、方法進行了系統(tǒng)化的論述,為語言典藏的普遍規(guī)律增加了富有中國特色的個案和例證,充實了典藏理論和方法的細節(jié)內涵。語言典藏庫內容豐富,形式多樣,較為全面地反映了原生態(tài)的語言面貌。課題的開展對多學科跨專業(yè)研究所作的卓有成效的實踐探索,對于社會人文學科研究同計算機領域的深度結合具有重要意義。
