Title: | 藏文短语及其嵌套短语的提取 |
Author: | 毋建军
; 张俊林
; 孙乐
; 吴健
; 次仁罗布
; 陈俊杰
|
Source: | 中文信息处理前沿进展——中国中文信息学会二十五周年学术会议
|
Conference Name: | 中国中文信息学会二十五周年学术会议
|
Conference Date: | 2006
|
Issued Date: | 2006
|
Conference Place: | 北京
|
Keyword: | 藏文短语
; 嵌套短语
; 数据挖掘
; 短语搭配
|
Department: | 太原理工大学,计算机与软件学院,太原,030024;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;西藏大学,拉萨,850000;太原理工大学,计算机与软件学院,太原,030024
|
Sponsorship: | 中国中文信息学会
|
Abstract: | 本文提出一种自动提取藏文短语及其嵌套短语搭配的算法,它通过采用基于统计长短语内词语之间的触发共现和基于句法特征规则相结合的处理策略,利用数据挖掘中的Apriori算法和FTP Tree数据存储结构,克服了N-gram统计语言模型在藏文短语搭配提取中没有考虑语言本身结构特性的缺陷,实验结果表明,短语提取的准确率和召回率都有很大的提高. |
Language: | 中文
|
Content Type: | 会议论文
|
URI: | http://ir.iscas.ac.cn/handle/311060/11952
|
Appears in Collections: | 基础软件国家工程研究中心_会议论文
|
File Name/ File Size |
Content Type |
Version |
Access |
License |
|
藏文短语及其嵌套短语的提取.pdf(268KB) | -- | -- | 限制开放 | -- | 联系获取全文 |
|
Recommended Citation: |
毋建军,张俊林,孙乐,等. 藏文短语及其嵌套短语的提取[C]. 见:中国中文信息学会二十五周年学术会议. 北京. 2006.
|
|
|