中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 基础软件国家工程研究中心  > 期刊论文
题名:
基于词典的汉藏句子对齐研究与实现
作者: 于新 ; 吴健 ; 洪锦玲
关键词: 汉藏句子对齐 ; 词典 ; 分词粒度 ; 平行语料库 ; 藏文信息处理
刊名: 中文信息学报
发表日期: 2011
期: 4, 页:57-62
部门归属: 中国科学院软件研究所;中国科学院研究生院
摘要: 双语语料库加工的关键技术之一是对齐,构建句子级别的对齐语料是构建语料库最基本的任务。该文参考其他语言句子对齐的成熟的方法,针对藏文语言的特殊性,提出基于词典的汉藏句子对齐。整理了对齐所用双语词典,并对其词语覆盖率进行了评价。在汉藏句子对齐过程中发现汉语与藏文的分词粒度不同的问题,采用在藏汉词典中进一步查词并在汉语句子中比对的方法,使正确句对的得分增加,从而提高对齐正确率。采用该方法准确率为81.11%。
内容类型: 期刊论文
URI标识: http://ir.iscas.ac.cn/handle/311060/13909
Appears in Collections:基础软件国家工程研究中心_期刊论文

Files in This Item:
File Name/ File Size Content Type Version Access License
基于词典的汉藏句子对齐研究与实现.pdf(1107KB)----限制开放-- 联系获取全文

Recommended Citation:
于新,吴健,洪锦玲. 基于词典的汉藏句子对齐研究与实现[J]. 中文信息学报,2011-01-01(4):57-62.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[于新]'s Articles
[吴健]'s Articles
[洪锦玲]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[于新]‘s Articles
[吴健]‘s Articles
[洪锦玲]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace