中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 中科院软件所  > 中科院软件所
题名:
信息发现与检索技术中的一种在线学习算法
作者: 曾伟民
答辩日期: 2000
专业: 计算机应用技术
授予单位: 中国科学院软件研究所
授予地点: 中国科学院软件研究所
学位: 博士
关键词: 搜索引擎 ; 文档索引 ; 检索模型 ; 在线学习
摘要: 本文主要介绍了如何将信息发现与检索技术应用于WWW环境,使得Web用户能快速而准确地找到所需信息。搜索引擎主要分两部分,一是文档发现,另一是文档检索。文档发现的过程包括文档收集和文档索引,文档检索的关键则在于建立文档检索模型。我们介绍了多种文档检索模型,如布尔逻辑模型、向量空间模型和概率模型等,并提出了一种新的检索模型:文档覆盖模型。根据这些技术,我们设计并实现了一个搜索引擎原型。现有的搜索引擎系统的检索精确度都不高,为此,我们设计并实现了一种在线学习算法,通过不断地学习用户的反馈信息,逐步求精,缩小检索结果集,提高检索的精确度。另外,我们还将此在线学习算法应用于个人浏览代理,自动搜寻用户最喜爱的信息。
英文摘要: This article mainly introduces how to applying information retrieval technology to the World Wide Web (WWW) environment, so that Web users are able to find needed information quickly and exactly. Search engine mainly includes two parts. One is document discovery, the other is document search. Document discovery procedure must process document gathering and document indexing. The key of document search is the construction of document retrieval model. We introduce many of document search model, such as Boolean retrieval model, vector space model, probabilistic model, etc. We also present a new retrieval model which is document overlap model. According to these technologies, we designed and implemented a prototype of search engine. The precision of present search engines is not too high, so we designed and implemented an on-line learning algorithm. This algorithm learns the information of users' relevance feedback continuously, refines the result step by step, reduces the result collection and increases the search precision. In addition, we apply this on-line learning algorithm to personal browsing agent to search to user's favorite information automatically.
语种: 中文
内容类型: 学位论文
URI标识: http://ir.iscas.ac.cn/handle/311060/6604
Appears in Collections:中科院软件所

Files in This Item:
File Name/ File Size Content Type Version Access License
LW002129.pdf(1391KB)----限制开放-- 联系获取全文

Recommended Citation:
曾伟民. 信息发现与检索技术中的一种在线学习算法[D]. 中国科学院软件研究所. 中国科学院软件研究所. 2000-01-01.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[曾伟民]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[曾伟民]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace