中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 基础软件国家工程研究中心  > 学位论文
学科主题: 人工智能::自然语言处理
题名:
基于网络用户信息的个性化拼音输入法研究与实现
作者: 张顺昌
答辩日期: 2009-06-04
导师: 孙乐
授予单位: 中国国科学院软件研究所
授予地点: 北京
学位: 硕士
关键词: 中文输入,拼音输入法,音字转换,统计语言模型,个性化
摘要: 汉字输入技术是中文信息处理领域特有的一项基础性关键技术,中文输入法是中文用户使用计算机必备的应用软件。依赖于键盘的中文输入法可以分为两大类:基于汉字字形和基于拼音的输入法。据统计,拼音输入法是计算机用户最常用的汉字输入工具。 在互联网高速发展的今天,随着Web2.0以用户为中心的网络环境的流行,普通用户已经成为信息的发布者,而这对中文输入技术提出了更高的要求。因此,在这个时代背景下,如何进一步提高中文输入法的效率成为一个既有挑战性又有实际应用价值的研究课题。我们在分析了现有拼音输入法的基础上,主要在以下几个方面做了一些研究:  实现了一个基于统计语言模型的音字转换系统。针对音字转换系统中基于字的统计语言模型的一些问题进行了研究,提出了利用更多上下文信息来改进语言模型的方法,最后设计实验进行了验证和分析。  改进了基于分层隐马尔可夫模型的音字转换解码方法。对音字转换中拼音流切分作了分析,发现拼音流切分存在歧义,而且这些歧义对音字转换的准确率存在较大影响,提出了利用统计语言模型辅助拼音流切分的方法,最后设计实验进行验证。  对网络用户常用的应用以及用户的个性化因素(用户的聊天记录,浏览历史,搜索引擎查询历史)进行了分析与研究,实现了基于网络用户信息的个性化拼音输入法,提高输入法系统性能和用户输入体验。
语种: 中文
内容类型: 学位论文
URI标识: http://ir.iscas.ac.cn/handle/311060/141
Appears in Collections:基础软件国家工程研究中心_学位论文

Files in This Item:
File Name/ File Size Content Type Version Access License
zsc.pdf(745KB)----限制开放 联系获取全文

Recommended Citation:
张顺昌. 基于网络用户信息的个性化拼音输入法研究与实现[D]. 北京. 中国国科学院软件研究所. 2009-06-04.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[张顺昌]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[张顺昌]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace