Title: | 一种优化初始中心点的K平均文本聚类算法 |
Alternative Title: | variant of k-means algorithm for document clustering: optimization initial centers
|
Author: | 赵万磊
; 王永吉
; 张学杰
; 李娟
|
Keyword: | 优化
; 文本聚类
; K平均
; optimize
; document clustering
; K-means
|
Source: | 计算机应用
|
Issued Date: | 2005
|
Volume: | 25, Issue:9, Pages:2037-2040 | Indexed Type: | wanfang,cnki,cscd
|
Department: | 互联网软件技术实验室
|
Abstract: | 文本聚类在信息过滤,网页分类中有着很好的应用。但它面临数据量大,特征维度高的难点。由于K平均算法易于实现,对数据依赖度底,在文本聚类中得到应用。然而,传统K平均以及它的变种会产生有较大波动的聚类结果。因此对K平均算法进行了改进,通过优化聚类初始中心的选择,得到一种适合对文本数据聚类分析的改进算法。大量实验显示,该算法可以生成质量较高而且聚类质量波动性较小的结果。 |
Language: | 中文
|
Content Type: | 期刊论文
|
URI: | http://ir.iscas.ac.cn/handle/311060/3282
|
Appears in Collections: | 互联网软件技术实验室 _期刊论文
|
File Name/ File Size |
Content Type |
Version |
Access |
License |
|
26.pdf(527KB) | -- | -- | 限制开放 | -- | 联系获取全文 |
|
Recommended Citation: |
赵万磊,王永吉,张学杰,等. 一种优化初始中心点的K平均文本聚类算法[J]. 计算机应用,2005-01-01,25(9):2037-2040.
|
|
|