Institutional Repository
| 基于图的查询日志实体别名抽取方法 | |
| 其他题名 | Graph Based Alias Extraction Using Query Log |
| 石贝; 孙乐; 韩先培 | |
| 2013 | |
| 发表期刊 | 中文信息学报
![]() |
| ISSN | 1003-0077 |
| 卷号 | 27期号:5页码:149-155 |
| 摘要 | 实体的别名是指同一个实体的不同名称.传统的别名抽取方法存在训练语料构建困难和时效性差这两个问题.针对这两个问题,该文提出了一种基于图的查询日志实体别名抽取方法.该方法利用查询日志的上下文信息和查询链接信息,构建了二层图(包括别名候选图层和查询链接图层),并通过随机游走算法对图中的候选别名进行排序.实验结果表明:1)该方法准确率达到了71.8%,证明该方法可行有效.2)使用查询链接信息进行别名抽取优于使用上下文信息进行别名抽取.这两种信息的结合能获得更好的别名抽取效果. |
| 收录类别 | CSCD |
| 其他摘要 | The alias of entity means the different names which refer to the same entity. Traditional alias extraction methods often have two problems: 1) the difficulty of constructing training corpus; 2) the lack of timeliness. To resolve the two problems, this paper proposes a graph based alias extraction method using query log. This method uses context information and query-link information, constructs a two-layer graph (including the candidate alias layer and the query-link layer) and sorts the alias using random walk algorithm. The experimental results show that: 1) our method achieves the accuracy of 71.8%, which proves our method is effective. 2) Using query-link information outperforms the method which uses context information and the combination of this two type' s information improves the performance. |
| 关键词 | 查询日志 别名抽取 Query Log Alias Extraction |
| 部门归属 | 中国科学院软件研究所,北京,100190 |
| 语种 | 中文 |
| CSCD记录号 | CSCD:4969148 |
| 内容类型 | 期刊论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/16806 |
| 专题 | 中国科学院软件研究所 |
| 推荐引用方式 GB/T 7714 | 石贝,孙乐,韩先培. 基于图的查询日志实体别名抽取方法[J]. 中文信息学报,2013,27(5):149-155. |
| APA | 石贝,孙乐,&韩先培.(2013).基于图的查询日志实体别名抽取方法.中文信息学报,27(5),149-155. |
| MLA | 石贝,et al."基于图的查询日志实体别名抽取方法".中文信息学报 27.5(2013):149-155. |
| 条目包含的文件 | 条目无相关文件。 | |||||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [石贝]的文章 |
| [孙乐]的文章 |
| [韩先培]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [石贝]的文章 |
| [孙乐]的文章 |
| [韩先培]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [石贝]的文章 |
| [孙乐]的文章 |
| [韩先培]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论