中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 基础软件国家工程研究中心  > 会议论文
题名:
基于Labeled-LDA模型的文本分类新算法
作者: 李文波 ; 孙乐 ; 黄瑞红 ; 冯元勇 ; 张大鲲
会议文集: 第三届全国信息检索与内容安全学术会议论文集
会议名称: 第三届全国信息检索与内容安全学术会议
会议日期: 2007
出版日期: 2007
会议地点: 苏州
关键词: 文本分类 ; 图模型 ; 隐含狄利克雷分配 ; 变分推断
部门归属: 中国科学院软件研究所,北京 100080;中国科学院研究生院,北京 100049;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080
主办者: 中国中文信息学会
摘要: Latent Dirichlet Allocation(LDA)模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。通过在传统LDA模型中融入文本类别信息,本文提出了一种附加类别标签的LDA模型(Labeled-LDA)。基于该模型可以计算出隐含主题在各类别上的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷。与传统LDA模型的实验对比表明,基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能:在复且中文语料库上micro_F1提高约5.7%,在英文语料库20n
语种: 中文
内容类型: 会议论文
URI标识: http://ir.iscas.ac.cn/handle/311060/11024
Appears in Collections:基础软件国家工程研究中心_会议论文

Files in This Item:
File Name/ File Size Content Type Version Access License
基于Labeled-LDA模型的文本分类新算法.pdf(483KB)----限制开放-- 联系获取全文

Recommended Citation:
李文波,孙乐,黄瑞红,等. 基于Labeled-LDA模型的文本分类新算法[C]. 见:第三届全国信息检索与内容安全学术会议. 苏州. 2007.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[李文波]'s Articles
[孙乐]'s Articles
[黄瑞红]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[李文波]‘s Articles
[孙乐]‘s Articles
[黄瑞红]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace