ISCAS OpenIR  > 基础软件国家工程研究中心
藏文短语及其嵌套短语的提取
毋建军; 张俊林; 孙乐; 吴健; 次仁罗布; 陈俊杰
2006
会议名称中国中文信息学会二十五周年学术会议
会议录名称中文信息处理前沿进展——中国中文信息学会二十五周年学术会议
页码153-160
会议日期2006
会议地点北京
部门归属太原理工大学,计算机与软件学院,太原,030024;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;中国科学院软件研究所开放系统与中文信息处理中心,北京,100080;西藏大学,拉萨,850000;太原理工大学,计算机与软件学院,太原,030024
摘要本文提出一种自动提取藏文短语及其嵌套短语搭配的算法,它通过采用基于统计长短语内词语之间的触发共现和基于句法特征规则相结合的处理策略,利用数据挖掘中的Apriori算法和FTP Tree数据存储结构,克服了N-gram统计语言模型在藏文短语搭配提取中没有考虑语言本身结构特性的缺陷,实验结果表明,短语提取的准确率和召回率都有很大的提高.
关键词藏文短语 嵌套短语 数据挖掘 短语搭配
主办者中国中文信息学会
语种中文
内容类型会议论文
URI标识http://ir.iscas.ac.cn/handle/311060/11952
专题基础软件国家工程研究中心
推荐引用方式
GB/T 7714
毋建军,张俊林,孙乐,等. 藏文短语及其嵌套短语的提取[C],2006:153-160.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
藏文短语及其嵌套短语的提取.pdf(268KB) 开放获取--请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[毋建军]的文章
[张俊林]的文章
[孙乐]的文章
百度学术
百度学术中相似的文章
[毋建军]的文章
[张俊林]的文章
[孙乐]的文章
必应学术
必应学术中相似的文章
[毋建军]的文章
[张俊林]的文章
[孙乐]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。