中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 人机交互技术与智能信息处理实验室  > 期刊论文
题名:
基于PLSA模型的文本分割
其他题名: text segmentation based on plsa model
作者: 石晶 ; 戴国忠
关键词: 文本分割 ; 概率潜在语义分析 ; 相似性度量 ; 边界识别
刊名: 计算机研究与发展
发表日期: 2007
卷: 44, 期:2, 页:242-248
收录类别: EI,CSCD
部门归属: 人机交互技术与智能信息处理实验室
摘要: 文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用·基于PLSA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系·实验以汉语的整句作为基本块,尝试了多种相似性度量手段及边界估计策略,同时考虑相邻句重复的未登录词对相似值的影响,其最佳结果表明,片段边界的识别错误率为6·06%,远远低于其他同类算法·
语种: 中文
内容类型: 期刊论文
URI标识: http://ir.iscas.ac.cn/handle/311060/2202
Appears in Collections:人机交互技术与智能信息处理实验室_期刊论文

Files in This Item:
File Name/ File Size Content Type Version Access License
text-segment-based-plsa-model.pdf(430KB)----限制开放-- 联系获取全文

Recommended Citation:
石晶,戴国忠. 基于PLSA模型的文本分割[J]. 计算机研究与发展,2007-01-01,44(2):242-248.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[石晶]'s Articles
[戴国忠]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[石晶]‘s Articles
[戴国忠]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace