中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 人机交互技术与智能信息处理实验室  > 期刊论文
题名:
基于小世界模型的中文文本主题分析
其他题名: topic analysis of chinese text based on small world model
作者: 石晶 ; 胡明 ; 戴国忠
关键词: 计算机应用 ; 中文信息处理 ; 主题分析 ; 小世界模型 ; 文本分割 ; 词汇聚类
刊名: 中文信息学报
发表日期: 2007
卷: 21, 期:3, 页:69-75
收录类别: CSCD
部门归属: 人机交互技术与智能信息处理实验室
摘要: 本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由文本形成的词汇共现图呈现短路径,高聚集度的特性,说明小世界结构存在于文本中;然后依据小世界结构将词汇共现图划分为“簇”,通过计算“簇”在文本中所占的密度比重识别片段边界,使“簇”与片段对应起来;最后利用短路径,高聚集度的特性提取图“簇”的主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵。虽然国际上已有很多关于小世界结构及基于其上的应用研究,但利用小世界特性进行主题分析还是一个崭新的课题。实验表明,本文所给方法的结果明显好于其他方法,说明可以为下一步文本推理的工作提供有价值的预处理。
语种: 中文
Citation statistics:
内容类型: 期刊论文
URI标识: http://ir.iscas.ac.cn/handle/311060/2226
Appears in Collections:人机交互技术与智能信息处理实验室_期刊论文

Files in This Item:
File Name/ File Size Content Type Version Access License
topic-ana-chin-text-small-world.pdf(586KB)----限制开放-- 联系获取全文

Recommended Citation:
石晶,胡明,戴国忠. 基于小世界模型的中文文本主题分析[J]. 中文信息学报,2007-01-01,21(3):69-75.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[石晶]'s Articles
[胡明]'s Articles
[戴国忠]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[石晶]‘s Articles
[胡明]‘s Articles
[戴国忠]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace