基于小世界模型的中文文本主题分析
其他题名topic analysis of chinese text based on small world model
石晶; 胡明; 戴国忠
2007
发表期刊中文信息学报
卷号21期号:3页码:69-75
摘要本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由文本形成的词汇共现图呈现短路径,高聚集度的特性,说明小世界结构存在于文本中;然后依据小世界结构将词汇共现图划分为“簇”,通过计算“簇”在文本中所占的密度比重识别片段边界,使“簇”与片段对应起来;最后利用短路径,高聚集度的特性提取图“簇”的主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵。虽然国际上已有很多关于小世界结构及基于其上的应用研究,但利用小世界特性进行主题分析还是一个崭新的课题。实验表明,本文所给方法的结果明显好于其他方法,说明可以为下一步文本推理的工作提供有价值的预处理。
收录类别CSCD
关键词计算机应用 中文信息处理 主题分析 小世界模型 文本分割 词汇聚类
部门归属人机交互技术与智能信息处理实验室
语种中文
CSCD记录号CSCD:2864115
内容类型期刊论文
URI标识http://ir.iscas.ac.cn/handle/311060/2226
专题人机交互技术与智能信息处理实验室
推荐引用方式
GB/T 7714
石晶,胡明,戴国忠. 基于小世界模型的中文文本主题分析[J]. 中文信息学报,2007,21(3):69-75.
APA 石晶,胡明,&戴国忠.(2007).基于小世界模型的中文文本主题分析.中文信息学报,21(3),69-75.
MLA 石晶,et al."基于小世界模型的中文文本主题分析".中文信息学报 21.3(2007):69-75.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
topic-ana-chin-text-(586KB) 开放获取--请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[石晶]的文章
[胡明]的文章
[戴国忠]的文章
百度学术
百度学术中相似的文章
[石晶]的文章
[胡明]的文章
[戴国忠]的文章
必应学术
必应学术中相似的文章
[石晶]的文章
[胡明]的文章
[戴国忠]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。