ISCAS OpenIR  > 基础软件国家工程研究中心
基于Labeled-LDA模型的文本分类新算法
其他题名Text Classification Based on Labeled-LDA Model
李文波; 孙乐; 张大鲲
2008
发表期刊计算机学报
卷号31期号:4页码:620-627
收录类别EI
其他摘要LDA(Latent Dirichlet Allocation)模型是近年来提出的一种能够提取文本隐含主题的非监督学习模型.通过在传统LDA模型中融入文本类别信息,文中提出了一种附加类别标签的LDA模型(Labeled-LDA).基于该模型可以在各类别上协同计算隐含主题的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷.与传统LDA模型的实验对比表明:基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能,在复旦大学中文语料库上micro_F1提高约5.7%,在英文语料库20newsgroup的comp子集上micro—F-提高约3%.
关键词文本分类
语种中文
内容类型期刊论文
URI标识http://ir.iscas.ac.cn/handle/311060/620
专题基础软件国家工程研究中心
推荐引用方式
GB/T 7714
李文波,孙乐,张大鲲. 基于Labeled-LDA模型的文本分类新算法[J]. 计算机学报,2008,31(4):620-627.
APA 李文波,孙乐,&张大鲲.(2008).基于Labeled-LDA模型的文本分类新算法.计算机学报,31(4),620-627.
MLA 李文波,et al."基于Labeled-LDA模型的文本分类新算法".计算机学报 31.4(2008):620-627.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
李文波per-03.pdf(671KB) 开放获取使用许可请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[李文波]的文章
[孙乐]的文章
[张大鲲]的文章
百度学术
百度学术中相似的文章
[李文波]的文章
[孙乐]的文章
[张大鲲]的文章
必应学术
必应学术中相似的文章
[李文波]的文章
[孙乐]的文章
[张大鲲]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。