民族语言文字信息处理技术研发中心简介
2020年05月12日 15:31

民族语言文字信息处理技术研发中心简介

2020年5月更新)

一、中心发展概况

1994年学校成立了民族文字信息处理研究所,2002年成立民族语言文字信息处理实验室(四川省高校重点实验室),2012年在此基础上建立了民族语言文字信息技术研发中心,目前包括民族文字信息处理研究所、民族语言文字信息处理实验室、中国西南少数民族语言资源库建设基地(与中国社会科学院共建)等科研与信息平台;全国彝语术语标准化工作委员会、全国高等院校彝汉双语教材编译审定委员会、四川省民族语言研究所也挂靠中心建设与管理。中心先后3次获共计1080万的国家财政部中心专项建设经费建设支持。在著名语言文字信息处理专家沙马拉毅教授的带领下,中心长期致力于民族语言文字信息化的研究与教学工作,在民族语言文字信息处理领域(彝、藏、傣、纳西、羌、花瑶)已取得了一系列具有开拓性的研究成果,相关成果填补了国际、国内空白,在国内外学术界产生了较大影响,为民族语文工作的现代化、信息化的全面开展提供了强有力的技术支撑,现已成为全国具有鲜明学术特色的民族语言文字信息化?处理技术的研发基地、人才培养基地。

2016年11月中心因各项工作落实到位、成效突出被学校遴选为“共产党员示范团队”;2017年9月荣获西南民族大学2016—2017学年民族团结进步先进集体荣誉称号。

中心在学校特色、优势学科--中国少数民族语言文学专业(藏、彝)的基础上,相继开设了民族语言文字信息处理硕士研究生专业和本科专业,形成了较为完整的专业人才培养体系。

、中心建设与研究目标

中心坚持为民族地区信息化建设、发展服务的宗旨,根据学校“一体两翼”发展规划,坚持走特色发展、内涵发展道路,在民族语言信息处理、民族语言语料库、民族古籍文献的信息化建设、民族语言移动设备信息处理研究等领域开展交叉研究和创新实践中,与民族地区信息化建设、文化传播、文化资源库建设等社会现实需求紧密结合;同时结合中心的特色优势,把中心工作与信息化时代民族语言与传统文化的发展、传播与传承创新结合起来,探索民族传统文化的发展及其在大数据时代的保护、传承的理论与技术支撑;积极推进民族文化的数字化研究进程,通过形式新颖、凸显特色、主题鲜明的信息化研究成果,立体化呈现、弘扬、传承优秀的民族传统文化。

三、中心研究工作进展

中心在民族文字信息处理技术研究方面取得了60余项科研成果,完成国家自然科学基金项目1项;完成国家社会科学基金项目2项;主持制定了信息处理国家标准3项,国际标准1项;获国家专利1项、软著专利2项;完成省部级科研项目12项;完成合作开发项目6项;完成省部级以下项目26项;发表相关学术论文100余篇;获省部级以上教学科研成果奖励9项。目前在研国家社科基金重大项目1项,国家社会科学基金重大专项子课题1项,省部级科研项目4项,厅局级项目6项。

1.主要科研项目

1)《中国彝文古籍文献整理与保护及其数字化建设》,国家社科重大招标项目,在研;

2)《彝文信息处理及标准彝文字符集与编码的研制》,国家自然科学基金项目,完成;

3)《彝语语料库的研究与建设》,国家社科基金项目,完成;

4)《汉彝对照标注词库的建设》,国家社科基金项目,完成;

5)《高校彝汉双语教材数字化建设》,教育部项目,在研;

6)《彝汉双语教材建设与双语人才培养研究》,教育部项目,在研;

7)《彝语声学参数数据库的研究与建设》,教育部项目,完成;

8)《彝族传统医药术语整理及规范》,教育部项目,完成;

9)《彝语人名汉字音译转写规范》,教育部项目,完成;

10)《彝语常用术语汉字转写规范标准研制》,教育部项目,完成;

11)《藏、彝文全文献数据库》,国家民委项目,完成;

12)《彝族研究文献数据库》,国家民委项目,完成;

13)《信息处理用规范彝文分词系统的设计与实现》,国家民委项目,完成;

14)《少数民族语言水平测试标准研究(彝语文)》,国家民委项目,完成;

15)《彝文文献数据库》,四川省社科规划项目,完成;

16)《羌语语音数字化资源库建设》,四川省社科规划项目,完成;

17)《中小学教材汉彝对照电子词典》,四川省教育厅科研项目,完成;

18)《彝族史诗《勒俄》(四川省甘洛县)》国家社会科学基金重大专项子课题,在研;

19)《彝语方言综合资源数据库的建设研究》,教育部项目,在研;

20)《彝语方言基础词汇综合语料库的研究与建设》,国家民委重点研究基地重点项目,完成;

21)《彝语方言综合资源库的建设研究》,四川省社科项目;完成;

22)《通用彝文规范方案认知度及现行字库使用情况调查研究》,教育部项目,在研。

2.主要科研成果

1)《YWIN彝文系统》;

2)《ZWIN藏文系统》;

(3)《DWIN傣文系统》;

(4)《中小学教材汉彝对照电子词典》;

(5)《基于滇川黔桂古彝文系统》;

(6)《彝语元音声学参数库》;

(7)《通用彝文系统》;

(8)《彝文智能输入系统》;

(9)《藏文智能输入系统》;

(10)《纳西东巴文输入系统》;

(11)《彝语基础例句语料数据库》;

(12)《彝语分词、词性标注加工规范》;

(13)《汉彝对照词性标注系统》;

(14)《信息处理用彝、汉语平行语料库》;

(15)《彝语自动分析系统》;

(16)《彝语六大方言语音库》;

(17)《中国彝文典籍译丛电子多媒体光盘》;

(18)《跟我学彝语多媒体教学软件》;

(19)《规范彝文字词频统计系统》;

(20)《彝语自动分析系统》;

(21)《彝语基础例句语料数据库》;

(22)《彝语分词、词性标注加工规范》;

(23)《方正unicode彝文系统》;

(24)《方正彝文书版系统》;

(25)《彝、藏文手写手机》;

(26)《彝、藏文智能手机》;

(27)《彝、藏、傣语言学习平台》;

(28)《花瑶语音资源库》;

(29)《藏语尔苏语音数据库》;

(30)《藏语嘉绒语音数据库》;

(31)《藏语动词一词多义语料库》;

(32)《彝语在线语料库》;

(33)《彝文手写识别技术》。

(34《彝语同音异义语料库》、  

(35《基于Python的彝文词典分词系统》

(36)《中国彝文古籍文献数据库》

研制的计算机彝文输入法被应用于计算机彝文激光照排系统,填补了我国少数民族信息处理的一项空白,被两院院士王选命名为“沙马拉毅输入法”;2003年“计算机彝文输入码及其键盘”获国家专利;2005年研制出的“中小学汉彝对照电子词典”和“藏、彝文文献全文数据库研究与开发”均填补了国内相关方面的空白;2006年西南民族大学与北大方正合作开发的UNICODE彝文系统问世,计算机彝文字体从开始的2种发展到现在的白体、黑体、细黑体、宋体、仿宋体、综艺体、圆头体、手写体等8种字体;2007年西南民族大学与北大方正合作研发的彝文书版研发成功;2008年完成了“彝语六大方言语音库”的建设;2008年研制出的“彝汉双语平行语料库和术语库”是第一个针对彝语和汉语的平行语料库和术语库2009年研制出的“彝语语料库”是第一个大规模的彝语语料资源库;2009年西南民族大学与中国社会科学院民族学与人类学研究所合作开展“彝语声学参数数据库”研制成功,开创了彝语实验语音学研究的先河,也为西南少数民族语言实验语音学研究工作的开展进行了有意义的探索;2009年研制成功基于展讯平台藏、彝文手写机被誉为“藏、彝语文发展进程中的里程碑”,使历史悠久的藏、彝族传统文化与移动通信技术相结合,2012年又升级为藏、彝文安卓智能手写手机,为藏、彝语言文字向科技化、信息化迈进开辟了一条新路2010年彝汉双语词语标注语料库、彝汉人名汉字音译数据库、彝族传统医药术语数据库;2011年彝、汉、英三语平行语料库、通用彝文系统;2012年彝文智能输入法、藏文智能输入法、藏文拉丁转写方案;2013年3月完成藏语尔苏语音数据库、纳西东巴文智能输入系统;2014年-2016年开始藏语嘉绒语音库、花瑶语音库、藏、彝、傣民族语言学习平台的研发,为少数民族语言实验语音学研究工作的进一步开展奠定了丰富的语言数据基础;2017年完成的彝文手写识别技术的研发,推进彝语言文字进入现代信息智能处理领域的步伐;2018-2019完成中国彝文古籍文献数据库》的建设

这些研究成果的完成、推出都为相应民族语言文字信息处理技术的发展奠定了一个坚实的基础。而且,这些科研成果已相关领域得到广泛应用,为民族语文工作的现代化、信息化的全面开展提供了强有力的技术支撑。

3.科研成果获省部级及以上奖项

1)《信息交换用彝文编码字符集》,获四川省人民政府第六次哲学社会科学优秀科研成果三等奖;

2)《计算机信息处理彝文输入编码》,获四川省人民政府科技进步三等奖;

3)《计算机彝文信息处理》,获第五届中国民族图书奖二等奖;

4)《计算机彝文字输入方法》,获第五十一届尤里卡世界发明博览会金奖;

5)《计算机彝文信息处理》,获四川省第十次哲学社会科学优秀成果奖三等奖;

6)《四川民族地区少数民族语言文字应用的调查报告》,获国家民委社会科学研究成果奖调研报告三等奖;

7)《计算机彝文信息处理系统及系列研究成果》,获钱伟长中文信息处理科学技术奖二等奖;

8)《彝语言文学专业的多语言教学与实践》,获得四川省人民政府教学成果一等奖;

9)《彝语语料库的研究与建设》,获四川省第十六次哲学社会科学优秀成果奖二等奖。

10)《彝文古籍经典选译(1-3卷》,获四川省第十七次哲学社会科学优秀成果奖三等奖。

四、人才培养

中心在学校少数民族语言文学相关专业的基础上,相继开设了民族语言文字信息处理硕士研究生专业和本科专业,在学校民族学博士学开设了计算机民族文字信息处理课程,在藏学学院、彝学学院开设了民族语言文字信息处理技术本科课程,形成了较为完整的专业人才培养体系,共计培养硕士研究生41人(涵盖汉、藏、彝、白、苗等多个民族),其中毕业33人,6人获国家级奖学金,12人获校级优秀研究生、毕业生,现已成为民族语言信息处理化建设人才培养基地。

五、社会服务

1、中心一直在推进民族地区的信息化标准的建设,主持制定了计算机彝文信息处理国家标准3项,国际标准1项,特别是依托全国彝语术语标准化工作委员会,先后完成了《通用规范彝文》、《彝族传统医药术语整理及规范》、《彝语人名汉字音译转写规范》等规范的制定,为彝语文的规范化、标准化提供了依据,也为彝语文的应用和推广起到了积极的引导作用。

2、中心研究工作与社会需求相一直结合紧密,研发的藏、彝、傣文手机、民族语言学习平台(藏、彝、傣、花瑶),被誉为“藏、彝语文发展进程中的里程碑”,使历史悠久的藏、彝族传统文化与移动通信技术相结合,为藏、彝、傣等民族语言文字向科技化、信息化迈进开辟了一条新路,把藏、彝、傣语言文字的现代化传播手段带进了现代化的通讯时代。

3、完成的“彝语语料库”、“彝汉双语对照词汇语料库”是第一个大规模的彝语语料资源库,为彝语言教学、信息处理、科学研究等多方面提供丰富、翔实的语言数据。

4、完成的藏语嘉绒语音数据库、羌语语音数据库、藏语尔苏语音数据库、花瑶语音数据库,为少数民族语言实验语音学研究工作的进一步开展奠定了丰富的语言数据基础。

5、完成的彝文手写识别技术是彝族文化发展事业中的一件大事,标志着彝语言文字进入现代信息智能处理领域,将会有力地推动彝族文字和传统文化的保护和发展。  

6、与全国彝语术语标准化工作委员会、彝学学院等机构、单位联合承办“阿史拉则杯”全国大学生彝语文应用技能大赛。

时任中央政治局常委、中央书记处书记、刘云山,全国政协副主席、时任中国中央政治局委员、中宣部部长刘奇葆,国家民委副主任陈改户、时任四川省副省长张作哈、时任国家民委副主任吴仕民等参观了中心或会见了中心负责人,并对中心的科研成果都给予了很高的评价。

全国政协副主席、时任国家民委主任王正伟在西南民族大学视察时强调:西南民族大学许多专业走在了民族院校的前列,尤其是在藏彝族语言文字信息处理方面,出现了很多开拓性的和领先性的成果,为少数民族信息化建设做了贡献。

中央电视台、中国民族报、华西都市报、四川新闻网、人民网、新华网、国家民委网站、教育部网站等多家媒体和权威网站都用专题对中心完成的科研成果进行了报道,给予了很高的评价,为民族语言与传统文化的传承与创新发展提供了新的理论与实践探索,也将进一步提升民族文化对当今社会的解释力和影响力。

六、中心发展规划

在保持这些传统特色的基础上,在民族语言信息处理系统的开发、民族语言语料库的研究与建设、民族古籍文献数字化开发、民族语言的自然理解研究以及民族语言资源数据库的建设等方面进一步开拓研究领域,实现民族语言文字信息处理技术在深度挖掘、智能、数字化方面的突破,实现研究方向从对“民族语言文字符形式的计算机处理”到对“民族语言文字语义层面上的信息知识的智能挖掘和处理”的转变,开展民族语言语音资源库的建设,实现“视觉处理”和“听觉处理”的两条研究方向的齐头并进,为实现“字符处理”到“语义处理”打下坚实的基础;同时借助新的信息处理技术扩展民族语言文字信息处理技术的应用范围,逐步开展通讯终端的APP运用技术开发,拓宽中心的基础研究能力,使之成为能解决民族语言的实际应用、信息化建设进程中的基础性问题的研发与人才培养基地,成为发展少数民族地区科学、技术、文化,促进社会进步的新型科研中心。

(统计数据截至2020年5月15日)

西南民族大学版权所有 蜀ICP备11019012号