中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 基础软件国家工程研究中心  > 学位论文
学科主题: 人工智能::自然语言处理
题名:
基于图模型的信息检索技术研究及其应用
作者: 黄云平
答辩日期: 2010-06-08
导师: 孙乐
专业: 计算机软件与理论
授予单位: 中国科学院研究生院
授予地点: 北京
学位: 硕士
关键词: 信息检索
摘要: 信息检索与查询是网络用户最常用的网络服务之一。信息检索技术旨在帮助 用户在有限的时间内找到感兴趣的文档。近年来,基于语言模型的信息检索技术 因其良好的性能和较完备的理论基础而吸引了众多研究者。 文档模型和查询模型 的估计是影响语言模型信息检索系统性能的两个重要因素, 针对现有方法存在的 问题,本文从理论和实际应用两个方面开展了研究。主要工作总结如下: 第一、对目前统计语言模型信息检索技术进行了较为全面和深入的综述。从 相关度估计方法、文档模型和查询模型等方面,对目前语言模型信息检索研究工 作进行了分析,并对一些有代表性的工作进行了介绍。讨论了语言模型信息检索 技术在个性化搜索中的应用。最后基于上述研究现状的分析,给出了语言模型信 息检索未来值得研究的几个方向。 第二、提出一种基于局部词图的文档平滑方法。对于每个文档,我们获取这 篇文档最相似的K个文档,使用这K个文档和文档本身建立一个局部文档集L。在 这个局部文档集L上建立一个局部词图:节点为L中的词项,边为两个节点在L中 的同现次数。然后在这个词图上使用类似PageRank的排序方法计算节点的权重, 使用节点的权重估计文档模型。 在3个TREC数据集上的实验结果验证了该方法的 有效性。 第三、提出一种基于图的迭代增强个性化检索算法。利用文档与文档、文档 与词、词与词这三种相互增强关系来计算词的权值和检索结果文档的得分。并根 据词的权值进行查询扩展,根据文档的得分进行查询结果的重排序。通过查询扩 展可以丰富结果文档,并通过重排序把用户关注的个性化文档推荐给用户。实验 结果表明,本文提出的个性化检索算法能够有效地提高检索精度。最后,基于该 算法,我们实现了IE浏览器插件形式的个性化检索工具GBAIR。
语种: 中文
内容类型: 学位论文
URI标识: http://ir.iscas.ac.cn/handle/311060/2340
Appears in Collections:基础软件国家工程研究中心_学位论文

Files in This Item:
File Name/ File Size Content Type Version Access License
基于图模型的信息检索研究及其应用0423.pdf(684KB)----限制开放 联系获取全文

Recommended Citation:
黄云平. 基于图模型的信息检索技术研究及其应用[D]. 北京. 中国科学院研究生院. 2010-06-08.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[黄云平]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[黄云平]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace