ISCAS OpenIR  > 基础软件国家工程研究中心
基于Labeled-LDA模型的文本分类新算法
李文波; 孙乐; 黄瑞红; 冯元勇; 张大鲲
2007
会议名称第三届全国信息检索与内容安全学术会议
会议录名称第三届全国信息检索与内容安全学术会议论文集
页码110-116
会议日期2007
会议地点苏州
部门归属中国科学院软件研究所,北京 100080;中国科学院研究生院,北京 100049;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080
其他摘要Latent Dirichlet Allocation(LDA)模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。通过在传统LDA模型中融入文本类别信息,本文提出了一种附加类别标签的LDA模型(Labeled-LDA)。基于该模型可以计算出隐含主题在各类别上的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷。与传统LDA模型的实验对比表明,基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能:在复且中文语料库上micro_F1提高约5.7%,在英文语料库20n
关键词文本分类 图模型 隐含狄利克雷分配 变分推断
主办者中国中文信息学会
语种中文
内容类型会议论文
URI标识http://ir.iscas.ac.cn/handle/311060/11024
专题基础软件国家工程研究中心
推荐引用方式
GB/T 7714
李文波,孙乐,黄瑞红,等. 基于Labeled-LDA模型的文本分类新算法[C],2007:110-116.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
基于Labeled-LDA模型的文本分类(483KB) 开放获取--请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[李文波]的文章
[孙乐]的文章
[黄瑞红]的文章
百度学术
百度学术中相似的文章
[李文波]的文章
[孙乐]的文章
[黄瑞红]的文章
必应学术
必应学术中相似的文章
[李文波]的文章
[孙乐]的文章
[黄瑞红]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。