ISCAS OpenIR  > 基础软件国家工程研究中心
基于图模型的信息检索技术研究及其应用
黄云平
Major计算机软件与理论
Supervisor孙乐
2010-06-08
Degree Grantor中国科学院研究生院
Degree Level硕士
Place of Degree Grantor北京
Keyword信息检索
English Abstract信息检索与查询是网络用户最常用的网络服务之一。信息检索技术旨在帮助 用户在有限的时间内找到感兴趣的文档。近年来,基于语言模型的信息检索技术 因其良好的性能和较完备的理论基础而吸引了众多研究者。 文档模型和查询模型 的估计是影响语言模型信息检索系统性能的两个重要因素, 针对现有方法存在的 问题,本文从理论和实际应用两个方面开展了研究。主要工作总结如下: 第一、对目前统计语言模型信息检索技术进行了较为全面和深入的综述。从 相关度估计方法、文档模型和查询模型等方面,对目前语言模型信息检索研究工 作进行了分析,并对一些有代表性的工作进行了介绍。讨论了语言模型信息检索 技术在个性化搜索中的应用。最后基于上述研究现状的分析,给出了语言模型信 息检索未来值得研究的几个方向。 第二、提出一种基于局部词图的文档平滑方法。对于每个文档,我们获取这 篇文档最相似的K个文档,使用这K个文档和文档本身建立一个局部文档集L。在 这个局部文档集L上建立一个局部词图:节点为L中的词项,边为两个节点在L中 的同现次数。然后在这个词图上使用类似PageRank的排序方法计算节点的权重, 使用节点的权重估计文档模型。 在3个TREC数据集上的实验结果验证了该方法的 有效性。 第三、提出一种基于图的迭代增强个性化检索算法。利用文档与文档、文档 与词、词与词这三种相互增强关系来计算词的权值和检索结果文档的得分。并根 据词的权值进行查询扩展,根据文档的得分进行查询结果的重排序。通过查询扩 展可以丰富结果文档,并通过重排序把用户关注的个性化文档推荐给用户。实验 结果表明,本文提出的个性化检索算法能够有效地提高检索精度。最后,基于该 算法,我们实现了IE浏览器插件形式的个性化检索工具GBAIR。
Subject自然语言处理
Language中文
Content Type学位论文
URIhttp://ir.iscas.ac.cn/handle/311060/2340
Collection基础软件国家工程研究中心
Recommended Citation
GB/T 7714
黄云平. 基于图模型的信息检索技术研究及其应用[D]. 北京. 中国科学院研究生院,2010.
Files in This Item:
File Name/Size DocType Version Access License
基于图模型的信息检索研究及其应用0423(684KB) 开放获取LicenseApplication Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[黄云平]'s Articles
Baidu academic
Similar articles in Baidu academic
[黄云平]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[黄云平]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.