Institutional Repository
| 基于单字提示特征的中文命名实体识别快速算法 | |
| 冯元勇; 孙乐; 张大鲲; 李文波 | |
| 2007 | |
| Conference Name | 第三届全国信息检索与内容安全学术会议 |
| Source | 第三届全国信息检索与内容安全学术会议论文集 |
| Pages | 575-281 |
| Conference Date | 2007 |
| Conference Place | 苏州 |
| Department | 中国科学院软件研究所基础软件中心,北京 100080;中国科学院研究生院,北京 100080;中国科学院软件研究所基础软件中心,北京 100080;中国科学院软件研究所基础软件中心,北京 100080;中国科学院研究生院,北京 100080;中国科学院软件研究所基础软件中心,北京 100080;中国科学院研究生院,北京 100080 |
| English Abstract | 近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(linear-chain)模型一般采用L-BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价 |
| Keyword | 中文命名实体识别 条件随机场 自然语言处理 机器学习 中文信息处理 |
| Sponsorship | 中国中文信息学会 |
| Language | 中文 |
| Content Type | 会议论文 |
| URI | http://ir.iscas.ac.cn/handle/311060/11028 |
| Collection | 基础软件国家工程研究中心 |
| Recommended Citation GB/T 7714 | 冯元勇,孙乐,张大鲲,等. 基于单字提示特征的中文命名实体识别快速算法[C],2007:575-281. |
| Files in This Item: | ||||||
| File Name/Size | DocType | Version | Access | License | ||
| 基于单字提示特征的中文命名实体识别快速算(417KB) | 开放获取 | -- | Application Full Text | |||
Items in the repository are protected by copyright, with all rights reserved, unless otherwise indicated.
Edit Comment