中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 基础软件国家工程研究中心  > 期刊论文
题名:
汉藏短语对抽取中短语译文获取方法研究
作者: 诺明花 ; 吴健 ; 刘汇丹 ; 丁治明
关键词: 藏文语块 ; 短语译文获取 ; 藏文信息处理 ; 中文信息处理
刊名: 中文信息学报
发表日期: 2011
期: 3, 页:112-117
部门归属: 中国科学院软件研究所;中国科学院研究生院
摘要: 该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术。考虑现阶段藏文资源不足,词法句法相关技术不成熟,该文提出藏文词串频率统计方法(TSM)和藏文词序列相交算法(TIA)两种方法来获取藏语译文。其中TSM抽取1-1连续和非连续短语准确率达到90%左右,但遗漏1-n情况。TIA能够抽取1-n连续和非连续藏文语块,准确率达到81%。
内容类型: 期刊论文
URI标识: http://ir.iscas.ac.cn/handle/311060/13943
Appears in Collections:基础软件国家工程研究中心_期刊论文

Files in This Item:
File Name/ File Size Content Type Version Access License
汉藏短语对抽取中短语译文获取方法研究.pdf(2304KB)----限制开放-- 联系获取全文

Recommended Citation:
诺明花,吴健,刘汇丹,等. 汉藏短语对抽取中短语译文获取方法研究[J]. 中文信息学报,2011-01-01(3):112-117.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[诺明花]'s Articles
[吴健]'s Articles
[刘汇丹]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[诺明花]‘s Articles
[吴健]‘s Articles
[刘汇丹]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace