当前位置:文化 > 文化新闻 > 正文

中国建成8000万词级蒙古言语语料库 已上线运行

2016-01-22 16:18:55      参与评论()人

中新网呼和浩特1月22日电 (记者 李爱平)22日,记者从内蒙古自治区社会科学院证实,历经10年,由中国内蒙古自治区政府启动的蒙古语语料库建设工程一期工程已完成,已建成8000万词级蒙古言语语料库,并上线运行。

蒙古语语料库建设工程于2005年启动,在实施的10年间,课题组在使用蒙古语的中国8个省区、蒙古国的5个省市、俄罗斯布里亚特共和国和卡尔梅克共和国境内的97个采集点,搜集了6725人共4192小时的自然口语语料和4000多小时的书面语料,建成8000万词级蒙古言语语料库。

蒙古语语料库建设工程首席专家巴特尔介绍,蒙古语语料库建设工程计划用20年建成中国首个2亿词级的蒙古语、达斡尔语、鄂温克语、鄂伦春语大型综合性语料库。工程分2期进行,目前,一期工程已完成,二期工程开始实施。

巴特尔认为,蒙古语语料库建设工程将为抢救濒危民族语言、保护弱势语言、保存开发利用蒙古语等少数民族语言资源提供基础,并为蒙古语等少数民族语言文字的规范化、信息化提供一个理想的信息资源。(完)