字符级的维吾尔语形态协同分析方法  

Collaborative Analysis of Uyghur Morphology Based on Character Level

加关注

作  者:吐尔洪·吾司曼[1,2,3] 杨雅婷 艾孜孜·吐尔逊[4] 程力 Turghun Osman;YANG Yating;Eziz Tursun;CHENG Li(Xinjiang Technical Institute of Physics&Chemistry,Chinese Academy of Science,Urumqi 830011;University of Chinese Academy of Science,Beijing 100049;Xinjiang Laboratory of Minority Speech and Language Information Processing,Urumqi 830011;Institute of Mathematics and Information of Hotan Teachers College,Hotan 848000)

机构地区:[1]中国科学院新疆理化技术研究所,乌鲁木齐830011 [2]中国科学院大学,北京100049 [3]新疆民族语音语言信息处理实验室,乌鲁木齐830011 [4]和田师范专科学校数学与信息学院,和田848000

出  处:《北京大学学报:自然科学版》2019年第1期47-54,共8页Acta Scientiarum Naturalium Universitatis

基  金:中国科学院“西部之光”人才培养计划基金(2017-XBZG-BR-001,2017-XBQNZ-A-005);国家“千人计划”项目(Y32H251201);国家自然科学基金(U1703133);中国科学院青年创新促进会基金(2017472)资助.

摘  要:针对维吾尔语中构形词缀种类多、构形复杂以及发生音变现象等问题,提出一种基于字符级的维吾尔语形态协同分析方法。该方法最大的特点是同时进行维吾尔语的形态切分、形态标注以及音变还原,将词素边界、形态标记以及音变信息用一个复合标记描述,采用字符序列的标注方法进行训练。实验结果显示,形态切分、形态标注及音变还原的正确率分别达到96.39%,92.78%和99.79%,系统总体正确率达92.59%。The Uyghur language has various inflectional affixes,complex structures and phonetic changes.The authors propose a collaborative analysis method for Uyghur morphology at character level.It includes three procedures:morpheme segmentation,morphological annotation and reduction of phonetic changes.The main characteristics of this method is to use a composite tag to represent the morpheme boundaries,annotations and phonetic changes.In addition,character sequence annotation is used to train the model.Experimental results show that the accurency of morpheme segmentation,morphological annotation and reduction of phonetic reaches 96.39%,92.78%and 99.79%respectively.The overall accuracy of the system reaches 92.59%.

关 键 词:维吾尔语 形态分析 协同分析 

分 类 号:S891[农业科学—特种经济动物饲养;农业科学—畜牧兽医]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象