ISCAS OpenIR  > 基础软件国家工程研究中心
Smoothing LDA Model for Text Categorization
Li Wenbo; Le Sun; Yuanyong Feng; Dakun Zhang
2008
会议名称待定
会议录名称Lecture Notes in Computer Science
页码83-94
会议日期39766
会议地点Harbin,China
收录类别EI,ISTP
出版地北京
出版者科学出版社
ISSN1234-5678
摘要Abstract. Latent Dirichlet Allocation (LDA) is a document level language model. In general, LDA employ the symmetry Dirichlet distribution as prior of the topic-words’ distributions to implement model smoothing. In this paper, we propose a data-driven smoothing strategy in which probability mass is allocated from smoothing-data to latent variables by the intrinsic inference procedure of LDA. In such a way, the arbitrariness of choosing latent variables'priors for the multi-level graphical model is overcome. Following this data-driven strategy,two concrete methods, Laplacian smoothing and Jelinek-Mercer smoothing, are employed to LDA model. Evaluations on different text categorization collections show data-driven smoothing can significantly improve the performance in balanced and unbalanced corpora.
关键词Text Categorization Latent Dirichlet Allocation Smoothing Graphical Model
学科领域固体力学
语种英语
内容类型会议论文
URI标识http://ir.iscas.ac.cn/handle/311060/808
专题基础软件国家工程研究中心
推荐引用方式
GB/T 7714
Li Wenbo,Le Sun,Yuanyong Feng,et al. Smoothing LDA Model for Text Categorization[C]. 北京:科学出版社,2008:83-94.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
lwb-conf-01.pdf(389KB) 开放获取--请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[Li Wenbo]的文章
[Le Sun]的文章
[Yuanyong Feng]的文章
百度学术
百度学术中相似的文章
[Li Wenbo]的文章
[Le Sun]的文章
[Yuanyong Feng]的文章
必应学术
必应学术中相似的文章
[Li Wenbo]的文章
[Le Sun]的文章
[Yuanyong Feng]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。