中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 软件所图书馆  > 期刊论文
题名:
基于Context Graphs的主题爬虫的研究与实现
作者: 陈星
关键词: 主题爬虫 ; Context Graphs模型 ; 层次建模 ; 链接分析 ; 内容分析
刊名: 计算机工程与设计
发表日期: 2011
期: 3, 页:914-917
收录类别: cnki
部门归属: 中国科学院软件研究所;中国科学院研究生院
摘要: 为了解决传统主题爬虫对主题网页搜索效率偏低的问题,分析了基于网络拓扑结构建模的Context Graphs的爬行策略。考虑了以往ContextGraphs方法存在的不足,即没有区分网页不同部分文本的重要程度,通过将锚文字、页面标题和页面内容做综合考虑,对原算法进行了改进。将改进前后的算法进行实验对比,实验结果表明,在提高主题爬行质量方面,改进后的算法达到了更好的效果。
内容类型: 期刊论文
URI标识: http://ir.iscas.ac.cn/handle/311060/13935
Appears in Collections:软件所图书馆_期刊论文

Files in This Item:
File Name/ File Size Content Type Version Access License
基于ContextGraphs的主题爬虫的研究与实现.pdf(343KB)----限制开放-- 联系获取全文

Recommended Citation:
陈星. 基于Context Graphs的主题爬虫的研究与实现[J]. 计算机工程与设计,2011-01-01(3):914-917.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[陈星]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[陈星]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace