數位語言資源工作室
主要任務
- 定期整合本所研究人員在語言資源項目方面的需求。
- 協助處理文字相關技術。
- 本所各種語言資料資源的永續維護與發展。
- 處理中研院西夏電腦字型的顯示問題。
- 資料儲存及備份。
沿革與目標
語言學研究所於1997年成立籌備處之時,為了建立共通的工具平台、促進資源共享,組成三個研究群組,「文獻語料庫研究室」即為其中之一。「文獻語料庫研究室」原為本院史語所研究室,隨語言學研究所籌備處成立而遷移。草創之初,研究室成員與本院資訊所相關研究人員、計算中心技術人員合作,推展如語料庫及詞彙庫構建,及以語料庫為基礎之各種語言學研究。
因應語言學門跨領域研究日盛,2009年底本所重組研究群,「文獻語料庫研究室」改組為「語料庫與計算語言學研究群」。時值國內外語言學研究在軟體、硬體、資訊等各方面發展迅速,並朝著系統化語料庫建置與研究方向邁進。不論是語言田野調查、社會語言調查、認知神經語言科學研究、語言科技的發展都與語料的收集有密不可分的關係。而語料庫的建置過程、發音人或文字語料的選取、文體或情境的設計都會影響語料庫的性質,進而影響研究的結果;語料資源的共享成為語言學研究日益注重的焦點。計算語言學模擬與運算的協助提供驗證與尋找規則的工具,相當程度的幫助了語言學各項議題的開發。
2019年本所重新檢討研究群組對於研究工作的功能,於2020年建立「數位語言資源工作室」,以分階段整理本所研究同仁建置的語言資料庫、整合同仁在語言資源項目方面的需求為主要任務,並協助同仁處理文字技術上的問題。目標為使本所語料庫相關成果能永續保存、經營。
最後更新日期:2021-03-01