Institutional Repository
| 基于Context Graphs的主题爬虫的研究与实现 | |
| 陈星 | |
| 2011 | |
| Source | 计算机工程与设计
![]() |
| Issue | 3Pages:914-917 |
| English Abstract | 为了解决传统主题爬虫对主题网页搜索效率偏低的问题,分析了基于网络拓扑结构建模的Context Graphs的爬行策略。考虑了以往ContextGraphs方法存在的不足,即没有区分网页不同部分文本的重要程度,通过将锚文字、页面标题和页面内容做综合考虑,对原算法进行了改进。将改进前后的算法进行实验对比,实验结果表明,在提高主题爬行质量方面,改进后的算法达到了更好的效果。 |
| Indexed Type | cnki |
| Keyword | 主题爬虫 Context Graphs模型 层次建模 链接分析 内容分析 |
| Department | 中国科学院软件研究所;中国科学院研究生院 |
| Content Type | 期刊论文 |
| URI | http://ir.iscas.ac.cn/handle/311060/13935 |
| Collection | 中国科学院软件研究所 |
| Recommended Citation GB/T 7714 | 陈星. 基于Context Graphs的主题爬虫的研究与实现[J]. 计算机工程与设计,2011(3):914-917. |
| APA | 陈星.(2011).基于Context Graphs的主题爬虫的研究与实现.计算机工程与设计(3),914-917. |
| MLA | 陈星."基于Context Graphs的主题爬虫的研究与实现".计算机工程与设计 .3(2011):914-917. |
| Files in This Item: | ||||||
| File Name/Size | DocType | Version | Access | License | ||
| 基于ContextGraphs的主题爬虫(343KB) | 开放获取 | -- | Application Full Text | |||
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment