ISCAS OpenIR  > 基础软件国家工程研究中心
汉藏短语对抽取中短语译文获取方法研究
诺明花; 吴健; 刘汇丹; 丁治明
2011
Source中文信息学报
Issue3Pages:112-117
English Abstract该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术。考虑现阶段藏文资源不足,词法句法相关技术不成熟,该文提出藏文词串频率统计方法(TSM)和藏文词序列相交算法(TIA)两种方法来获取藏语译文。其中TSM抽取1-1连续和非连续短语准确率达到90%左右,但遗漏1-n情况。TIA能够抽取1-n连续和非连续藏文语块,准确率达到81%。
Keyword藏文语块 短语译文获取 藏文信息处理 中文信息处理
Department中国科学院软件研究所;中国科学院研究生院
Content Type期刊论文
URIhttp://ir.iscas.ac.cn/handle/311060/13943
Collection基础软件国家工程研究中心
Recommended Citation
GB/T 7714
诺明花,吴健,刘汇丹,等. 汉藏短语对抽取中短语译文获取方法研究[J]. 中文信息学报,2011(3):112-117.
APA 诺明花,吴健,刘汇丹,&丁治明.(2011).汉藏短语对抽取中短语译文获取方法研究.中文信息学报(3),112-117.
MLA 诺明花,et al."汉藏短语对抽取中短语译文获取方法研究".中文信息学报 .3(2011):112-117.
Files in This Item:
File Name/Size DocType Version Access License
汉藏短语对抽取中短语译文获取方法研究.p(2304KB) 开放获取--Application Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[诺明花]'s Articles
[吴健]'s Articles
[刘汇丹]'s Articles
Baidu academic
Similar articles in Baidu academic
[诺明花]'s Articles
[吴健]'s Articles
[刘汇丹]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[诺明花]'s Articles
[吴健]'s Articles
[刘汇丹]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.