Institutional Repository
| 基于Labeled-LDA模型的文本分类新算法 | |
| 李文波; 孙乐; 黄瑞红; 冯元勇; 张大鲲 | |
| 2007 | |
| 会议名称 | 第三届全国信息检索与内容安全学术会议 |
| 会议录名称 | 第三届全国信息检索与内容安全学术会议论文集 |
| 页码 | 110-116 |
| 会议日期 | 2007 |
| 会议地点 | 苏州 |
| 部门归属 | 中国科学院软件研究所,北京 100080;中国科学院研究生院,北京 100049;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080;中国科学院软件研究所,北京 100080 |
| 其他摘要 | Latent Dirichlet Allocation(LDA)模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。通过在传统LDA模型中融入文本类别信息,本文提出了一种附加类别标签的LDA模型(Labeled-LDA)。基于该模型可以计算出隐含主题在各类别上的分配量,从而克服了传统LDA模型用于分类时强制分配隐含主题的缺陷。与传统LDA模型的实验对比表明,基于Labeled-LDA模型的文本分类新算法可以有效改进文本分类的性能:在复且中文语料库上micro_F1提高约5.7%,在英文语料库20n |
| 关键词 | 文本分类 图模型 隐含狄利克雷分配 变分推断 |
| 主办者 | 中国中文信息学会 |
| 语种 | 中文 |
| 内容类型 | 会议论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/11024 |
| 专题 | 基础软件国家工程研究中心 |
| 推荐引用方式 GB/T 7714 | 李文波,孙乐,黄瑞红,等. 基于Labeled-LDA模型的文本分类新算法[C],2007:110-116. |
| 条目包含的文件 | ||||||
| 文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
| 基于Labeled-LDA模型的文本分类(483KB) | 开放获取 | -- | 请求全文 | |||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [李文波]的文章 |
| [孙乐]的文章 |
| [黄瑞红]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [李文波]的文章 |
| [孙乐]的文章 |
| [黄瑞红]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [李文波]的文章 |
| [孙乐]的文章 |
| [黄瑞红]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论