Title: | 基于组块及记忆的词性自动标注 |
Alternative Title: | block and memory based part of speech tagging
|
Author: | 石晶
; 戴国忠
|
Keyword: | 人工智能
; 词性自动标注
; 基于组块及记忆的模型
; 渐增式学习
|
Source: | 吉林大学学报(工学版)
|
Issued Date: | 2006
|
Volume: | 36, Issue:4, Pages:560-563 | Indexed Type: | EI,CSCD
|
Department: | 人机交互技术与智能信息处理实验室
|
Abstract: | 基于组块及记忆的模型(BMM)采用与传统方法明显不同的标注思路,以汉语中的整句为处理单元,从组块出发,立足于单个词汇,分析更为丰富的上下文语境知识,并借助知网词典记忆词性集合,同时采用渐增式的机械学习方式获取参数值。对于棘手的稀疏数据问题只简单地设置平伏常数加以平滑,最后利用少量人工规则修正标注结果。实验表明,该模型的封闭式测试准确率将近99%,开放式测试准确率为95%以上。 |
Language: | 中文
|
Content Type: | 期刊论文
|
URI: | http://ir.iscas.ac.cn/handle/311060/2220
|
Appears in Collections: | 人机交互技术与智能信息处理实验室_期刊论文
|
File Name/ File Size |
Content Type |
Version |
Access |
License |
|
block-memory-speech-tagging.pdf(442KB) | -- | -- | 限制开放 | -- | 联系获取全文 |
|
Recommended Citation: |
石晶,戴国忠. 基于组块及记忆的词性自动标注[J]. 吉林大学学报(工学版),2006-01-01,36(4):560-563.
|
|
|