中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 软件所图书馆  > 早期
题名:
一种基于向量空间模型的个性化搜索引擎的研究与设计
作者: 文振威
答辩日期: 2008-06-04
导师: 秦晓
专业: 计算机应用技术
授予单位: 中国科学院研究生院
授予地点: 中国科学院软件研究所
学位: 硕士
关键词: 个性化 ; 向量空间模型 ; 隐式反馈 ; 搜索引擎
其他题名: A study and design of personalized search engine based on vector space model
分类号: 暂无
索取号: 暂无
部门归属: 研究生部
摘要: 传统的搜索技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的查询请求。个性化服务技术就是针对这个问题而提出的,它为不同用户提供不同的服务,以满足不同的需求,实现针对不同用户进行相应信息筛选的目的。个性化服务技术能够充分提高搜索引擎的服务质量和访问效率,吸引更多的访问者。个性化搜索引擎是一种通过机器主动学习用户兴趣,并根据用户兴趣帮助用户进行信息筛选的新一代智能化搜索引擎。本文在对第二代搜索引擎分析的基础上,运用“隐式反馈技术”和“向量空间模型”,设计并实现了一个完整的可学习用户兴趣并可动态调整的个性化搜索引擎。本文的主要工作有:第一,对目前的搜索引擎技术和个性化信息检索技术进行了较为全面深入的探讨和综述。对于目前已经有的和正在探索中的各种个性化信息检索与提取技术进行介绍和分析。第二,在用户兴趣提取中,采用了基于隐式反馈技术的多级信息提取方法,提取用户点击历史中的信息。在其中采用了提取即时隐式反馈信息的多级信息沉淀的方法,能对用户短期的兴趣信息进行提取,以适应用户短期的异常行为,同时也可以通过这些信息描述用户兴趣的转移。第三,在文档的相似度比较方面,采用了向量空间模型,并结合了布尔模型的优点进行了维度复杂性计算方面的改进。对于即时的隐式反馈信息,采用了一种挖掘关键词相互关系的算法来进行用户兴趣种类的判别并根据用户行为的上下文信息做出相应评价。第四,对每一次搜索,记录用户的点击历史并进行相应的分析,评价用户对于搜索结果的满意度,并动态得对搜索结果进行调整。本文所设计的搜索引擎能获得对于用户具有较高相关度的搜索结果,减少用户的检索负担,使用户能从大量繁杂的信息中迅速提取到对自己有用的信息,对于提高网络信息的利用效率和用户的工作效率具有十分重要的现实意义。
英文摘要: The traditional search engines indeed meet people's need in some degree, but they still can not satisfy the queries of different background, different target or different period, so the personalized service is present for this requirement. It can provide specific services for different needs, and supply different users with relevant information of them. So it can enhance the quality and the efficiency of the search engine's service, and attract more and more users. Personalized Search Engine is a new intelligentized search engine that automatically learns user’s interests and filters the information with these interests. In this paper, we designed a personalized search engine that can learn user's interests and make dynamic adjust for specific context using the "implicit feedback technology" and the "vector space model". The main work includes: 1. Discuss and summarize the technology of search engine and personalized information retrieval. 2. Use Multi-level information extracting technology based on implicit feedback to extract information from users’ hit history. It can extract the immediate information to adapt the immediate abnormal action of users and also depict the transfer of users’ interest. 3. Use vector space model to assess the similarity degree of documents and make improvement with Boolean models on dimension complexity. Use a new method to mine the relationship between keywords in the immediate implicit feedback information from users’ action context. 4. Use a dynamic method to get the evaluation from users and make relevant adjust to the search results. The system designed in this paper can supply users with high relevant results hence reduce the work of users when searching the results. It can enhance the usage of internet information and the efficiency of users work.
内容类型: 学位论文
URI标识: http://ir.iscas.ac.cn/handle/311060/6630
Appears in Collections:中科院软件所图书馆_早期

Files in This Item:
File Name/ File Size Content Type Version Access License
10001_200528015029106文振威_paper.doc(1048KB)----限制开放-- 联系获取全文

Recommended Citation:
文振威. 一种基于向量空间模型的个性化搜索引擎的研究与设计[D]. 中国科学院软件研究所. 中国科学院研究生院. 2008-06-04.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[文振威]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[文振威]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace