Title: | 基于标记的规则统计模型与未登录词识别算法 |
Alternative Title: | a rule-statistic model based on tag and an algorithm to recognize unknown words
|
Author: | 苏菲
; 王丹力
; 戴国忠
|
Keyword: | 歧义标记
; 规则统计模型
; n元语法
; 词加权算法
|
Source: | 计算机工程与应用
|
Issued Date: | 2004
|
Volume: | 40, Issue:15, Pages:43-45,91 | Indexed Type: | CSCD
|
Department: | 人机交互技术与智能信息处理实验室
|
Abstract: | 该文针对小型词库,提出了基于规则统计模型的消歧方法和识别未登录词的词加权算法.通过大量语料库学习获取歧义高频字,作为歧义标记,利用规则统计模型对标记的上下文信息分类处理,剩下的部分进行正向或逆向动态最大匹配,对连续单字串使用词加权算法来判断其是否为未登录多字词.经过实验测试,该系统的准确率为98.88%,召回率为98.32%. |
Language: | 中文
|
Citation statistics: |
|
Content Type: | 期刊论文
|
URI: | http://ir.iscas.ac.cn/handle/311060/2106
|
Appears in Collections: | 人机交互技术与智能信息处理实验室_期刊论文
|
File Name/ File Size |
Content Type |
Version |
Access |
License |
|
rule-statistic-model-tag-algorithm.pdf(249KB) | -- | -- | 限制开放 | -- | 联系获取全文 |
|
Recommended Citation: |
苏菲,王丹力,戴国忠. 基于标记的规则统计模型与未登录词识别算法[J]. 计算机工程与应用,2004-01-01,40(15):43-45,91.
|
|
|