ISCAS OpenIR  > 人机交互技术与智能信息处理实验室
基于小世界模型的中文文本主题分析
Alternative Titletopic analysis of chinese text based on small world model
石晶; 胡明; 戴国忠
2007
Source中文信息学报
Volume21Issue:3Pages:69-75
English Abstract本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由文本形成的词汇共现图呈现短路径,高聚集度的特性,说明小世界结构存在于文本中;然后依据小世界结构将词汇共现图划分为“簇”,通过计算“簇”在文本中所占的密度比重识别片段边界,使“簇”与片段对应起来;最后利用短路径,高聚集度的特性提取图“簇”的主题词,采取背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘隐藏于字词表面之下的文本内涵。虽然国际上已有很多关于小世界结构及基于其上的应用研究,但利用小世界特性进行主题分析还是一个崭新的课题。实验表明,本文所给方法的结果明显好于其他方法,说明可以为下一步文本推理的工作提供有价值的预处理。
Indexed TypeCSCD
Keyword计算机应用 中文信息处理 主题分析 小世界模型 文本分割 词汇聚类
Department人机交互技术与智能信息处理实验室
Language中文
CSCD IDCSCD:2864115
Content Type期刊论文
URIhttp://ir.iscas.ac.cn/handle/311060/2226
Collection人机交互技术与智能信息处理实验室
Recommended Citation
GB/T 7714
石晶,胡明,戴国忠. 基于小世界模型的中文文本主题分析[J]. 中文信息学报,2007,21(3):69-75.
APA 石晶,胡明,&戴国忠.(2007).基于小世界模型的中文文本主题分析.中文信息学报,21(3),69-75.
MLA 石晶,et al."基于小世界模型的中文文本主题分析".中文信息学报 21.3(2007):69-75.
Files in This Item:
File Name/Size DocType Version Access License
topic-ana-chin-text-(586KB) 开放获取--Application Full Text
Related Services
Recommend this item
Bookmark
Usage statistics
Export to Endnote
Google Scholar
Similar articles in Google Scholar
[石晶]'s Articles
[胡明]'s Articles
[戴国忠]'s Articles
Baidu academic
Similar articles in Baidu academic
[石晶]'s Articles
[胡明]'s Articles
[戴国忠]'s Articles
Bing Scholar
Similar articles in Bing Scholar
[石晶]'s Articles
[胡明]'s Articles
[戴国忠]'s Articles
Terms of Use
No data!
Social Bookmark/Share
All comments (0)
No comment.
 

Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.