Institutional Repository
| 基于藏语字性标注的词性预测研究 | |
| 其他题名 | Tibetan POS Tagging Based on Syllable Tagging |
| 龙从军; 刘汇丹; 诺明花; 吴健 | |
| 2015 | |
| 发表期刊 | 中文信息学报
![]() |
| ISSN | 1003-0077 |
| 卷号 | 29期号:5页码:211-215 |
| 摘要 | 该文选取了藏语文中小学教材的部分语料,构建了带有藏语字性标记、词边界标记和词性标记的语料库,通过比较不同的分词、标注方法,证明分词、词性标注一体 化效果比分步进行的效果好,准确率、召回率和F值分别提高了0.067、0.073和0.07。但词级标注模型难以解决词边界划分的一致性和未登录词的问 题。基于此,作者提出可以利用字性和字构词的规律预测合成词的词性,既可以融入语言学知识又可以减少由未登录词导致的标注错误,实验结果证明,作为词性标 注的后处理模块,基于字性标注的词性预测准确率提高到了0.916,这个结果已经比分词标注一体化结果好,说明字性标注对纠正词性错误标注有明显的效果。 |
| 收录类别 | CSCD |
| 其他摘要 | A Tibetan corpus is constructed and annotated for the syllable markers,the word boundary markers and the part-of-speech(POS)tags,with texts selected from Tibetan textbooks of Primary and middle school.Then an empirical study reveals that the training data with the multi-level annotation can enhance the effects of POS tagging. Due to the strong relation between the POS tags of words and the tags Tibetan syllables,a method of Tibetan POS tagging by the Tibetan syllables is presented.The results of experiments show that syllable tags can correct certain errors caused in POS tagging. |
| 关键词 | 藏语 语字标注 分词 词性标注 |
| 部门归属 | 龙从军, 中国科学院软件研究所, 北京 100190, 中国;刘汇丹, 中国科学院软件研究所, 北京 100190, 中国;诺明花, 中国科学院软件研究所, 北京 100190, 中国;吴健, 中国科学院软件研究所, 北京 100190, 中国; |
| 语种 | 中文 |
| CSCD记录号 | CSCD:5600481 |
| 内容类型 | 期刊论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/17388 |
| 专题 | 中国科学院软件研究所 |
| 推荐引用方式 GB/T 7714 | 龙从军,刘汇丹,诺明花,等. 基于藏语字性标注的词性预测研究[J]. 中文信息学报,2015,29(5):211-215. |
| APA | 龙从军,刘汇丹,诺明花,&吴健.(2015).基于藏语字性标注的词性预测研究.中文信息学报,29(5),211-215. |
| MLA | 龙从军,et al."基于藏语字性标注的词性预测研究".中文信息学报 29.5(2015):211-215. |
| 条目包含的文件 | ||||||
| 文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
| 基于藏语字性标注的词性预测研究.pdf(1702KB) | 开放获取 | 使用许可 | 请求全文 | |||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [龙从军]的文章 |
| [刘汇丹]的文章 |
| [诺明花]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [龙从军]的文章 |
| [刘汇丹]的文章 |
| [诺明花]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [龙从军]的文章 |
| [刘汇丹]的文章 |
| [诺明花]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论