Institutional Repository
| 藏文短语及其嵌套短语的提取 | |
| 毋建军; 张俊林; 孙乐; 吴健; 次仁罗布; 陈俊杰 | |
| 2006 | |
| Conference Name | 中国中文信息学会二十五周年学术会议 |
| Source | 中文信息处理前沿进展——中国中文信息学会二十五周年学术会议 |
| Pages | 153-160 |
| Conference Date | 2006 |
| Conference Place | 北京 |
| Department | 太原理工大学,计算机与软件学院,太原,030024;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;西藏大学,拉萨,850000;太原理工大学,计算机与软件学院,太原,030024 |
| English Abstract | 本文提出一种自动提取藏文短语及其嵌套短语搭配的算法,它通过采用基于统计长短语内词语之间的触发共现和基于句法特征规则相结合的处理策略,利用数据挖掘中的Apriori算法和FTP Tree数据存储结构,克服了N-gram统计语言模型在藏文短语搭配提取中没有考虑语言本身结构特性的缺陷,实验结果表明,短语提取的准确率和召回率都有很大的提高. |
| Keyword | 藏文短语 嵌套短语 数据挖掘 短语搭配 |
| Sponsorship | 中国中文信息学会 |
| Language | 中文 |
| Content Type | 会议论文 |
| URI | http://ir.iscas.ac.cn/handle/311060/11952 |
| Collection | 基础软件国家工程研究中心 |
| Recommended Citation GB/T 7714 | 毋建军,张俊林,孙乐,等. 藏文短语及其嵌套短语的提取[C],2006:153-160. |
| Files in This Item: | ||||||
| File Name/Size | DocType | Version | Access | License | ||
| 藏文短语及其嵌套短语的提取.pdf(268KB) | 开放获取 | -- | Application Full Text | |||
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment