ISCAS OpenIR
基于Context Graphs的主题爬虫的研究与实现
陈星
2011
发表期刊计算机工程与设计
期号3页码:914-917
摘要为了解决传统主题爬虫对主题网页搜索效率偏低的问题,分析了基于网络拓扑结构建模的Context Graphs的爬行策略。考虑了以往ContextGraphs方法存在的不足,即没有区分网页不同部分文本的重要程度,通过将锚文字、页面标题和页面内容做综合考虑,对原算法进行了改进。将改进前后的算法进行实验对比,实验结果表明,在提高主题爬行质量方面,改进后的算法达到了更好的效果。
收录类别cnki
关键词主题爬虫 Context Graphs模型 层次建模 链接分析 内容分析
部门归属中国科学院软件研究所;中国科学院研究生院
内容类型期刊论文
URI标识http://ir.iscas.ac.cn/handle/311060/13935
专题中国科学院软件研究所
推荐引用方式
GB/T 7714
陈星. 基于Context Graphs的主题爬虫的研究与实现[J]. 计算机工程与设计,2011(3):914-917.
APA 陈星.(2011).基于Context Graphs的主题爬虫的研究与实现.计算机工程与设计(3),914-917.
MLA 陈星."基于Context Graphs的主题爬虫的研究与实现".计算机工程与设计 .3(2011):914-917.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于ContextGraphs的主题爬虫(343KB) 开放获取--请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[陈星]的文章
百度学术
百度学术中相似的文章
[陈星]的文章
必应学术
必应学术中相似的文章
[陈星]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。