Institutional Repository
| 基于多粒度特征和混合算法的文档推荐系统 | |
| 邬登峰 | |
| Major | 分布式软件系统工程 |
| Supervisor | 许舒人 |
| 2017-05 | |
| Degree Grantor | 中国科学院大学 |
| Degree Level | 硕士 |
| Place of Degree Grantor | 北京 |
| Abstract | 近年来,随着计算机的普及以及互联网技术的发展,信息采集、传播的速度达到了前所未有的水平,互联网逐渐成为了人们快速获取信息的重要渠道,这克服了传统方式受到的时间和空间的局限,但是也带来了“信息过载”的问题。文库系统作为互联网中一个重要的信息分享平台,同样面临着“信息过载”问题的考验。用户已无法通过浏览全部数据从而发掘真正感兴趣的内容,同时,由于推荐技术的发展,使其在很多领域都已经有充分的应用。因此将推荐技术应用到文库系统中,可以帮助用户发掘出其感兴趣的内容。 分类目录技术、搜索引擎技术等传统方法可以在一定程度上帮助用户在文库系统中检索信息,但是无法根据用户个体之间的差异,为用户展现差异化的检索结果,而且,在用户无法准确描述自身需求时,这些技术便无法为用户提供帮助了。 因此,本文引入推荐技术来解决文库系统中的“信息过载”问题,并为用户提供个性化服务。通过对文本数据的分析,设计了多粒度的用户兴趣模型及文档特征模型,针对用户兴趣漂移现象,提出了融合时间窗口法和遗忘函数法的解决方案。在用户兴趣模型和文档特征模型基础上,综合了基于内容推荐算法,协同过滤推荐算法以及社会化推荐的方法为用户生成了个性化文档推荐结果,为了发挥各推荐算法的优点,提升推荐系统整体的效果,设计了根据用户反馈动态的分配推荐位的融合策略,将多种算法的不同推荐结果融合成一个最优的推荐列表并展现给用户。此外,为提升系统整体的计算效率及灵活性,还设计倒排算法、增量计算、离线计算、多线程、灵活的配置文件等优化方案。 本文基于对用户需求及文档推荐技术的深入研究,设计并实现了一个基于多粒度特征和混合算法的文档推荐系统。在实验部分,针对系统的准确率、召回率、覆盖率、新颖度等指标做了量化测试,测试结果表明本系统能在一定程度上为用户提供可靠的个性化文档推荐服务。 |
| Content Type | 学位论文 |
| URI | http://ir.iscas.ac.cn/handle/311060/19003 |
| Collection | 软件工程技术研究开发中心 |
| Affiliation | 中国科学院软件研究所 |
| Recommended Citation GB/T 7714 | 邬登峰. 基于多粒度特征和混合算法的文档推荐系统[D]. 北京. 中国科学院大学,2017. |
| Files in This Item: | ||||||
| File Name/Size | DocType | Version | Access | License | ||
| 基于多粒度特征和混合算法的文档推荐系统.(4066KB) | 学位论文 | 开放获取 | CC BY-NC-SA | Application Full Text | ||
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment