Institutional Repository
| 基于翻译模型的查询会话检测方法研究 | |
| 其他题名 | A Translation Model Based Method for Query Session Detection |
| 张振中; 孙乐; 韩先培 | |
| 2015 | |
| 发表期刊 | 中文信息学报
![]() |
| ISSN | 1003-0077 |
| 卷号 | 29期号:4页码:95-102 |
| 摘要 | 查询会话检测的目的是确定用户为了满足某个特定需求而连续提交的相关查询。查询会话检测对于查询日志分析以及用户行为分析来说是非常有用的。传统的查询会 话检测方法大都基于查询词的比较,无法解决词语不匹配问题(vocabulary-mismatch problem)---有些主题相关的查询之间并没有相同的词语。为了解决词语不匹配问题,我们在该文提出了一种基于翻译模型的查询会话检测方法,该方法 将词与词之间的关系刻画为词与词之间的翻译概率,这样即使词与词之间没有相同的词语,我们也可以捕捉到它们之间的语义关系。同时,我们也提出了两种从查询 日志中估计词翻译概率的方法,第一种方法基于查询的时间间隔,第二种方法基于查询的点击URLs。实验结果证明了该方法的有效性。 |
| 收录类别 | CSCD |
| 其他摘要 | Query session detection is critical for query log analysis and user behavior characterization.It aims at identifying the consecutive queries submitted by a user for the same information need.Traditional query session detection methods are based on lexical comparisons,which often suffer from the vocabulary-mismatch problem(i.e,the topically related queries may not share any common words).To resolve the issue,this paper proposes a translation model based method for query session detection,which can model the relationship between words as word translation probability.In this way our method can capture the relatedness between queries even they do not share any common words.Furthermore,we also propose two approaches for generating training data from web query log for translation probability estimation.The first approach is based on time gap between queries and the second is based on the clicked URLs of queries.Experimental results show that our method can significantly outperform the baselines. |
| 关键词 | 查询会话检测 词语不匹配问题 查询日志 |
| 部门归属 | 张振中, 中国科学院软件研究所基础软件中心, 北京 100190, 中国;孙乐, 中国科学院软件研究所基础软件中心, 北京 100190, 中国;韩先培, 中国科学院软件研究所基础软件中心, 北京 100190, 中国; |
| 语种 | 中文 |
| CSCD记录号 | CSCD:5553930 |
| 内容类型 | 期刊论文 |
| URI标识 | http://ir.iscas.ac.cn/handle/311060/17402 |
| 专题 | 中国科学院软件研究所 |
| 推荐引用方式 GB/T 7714 | 张振中,孙乐,韩先培. 基于翻译模型的查询会话检测方法研究[J]. 中文信息学报,2015,29(4):95-102. |
| APA | 张振中,孙乐,&韩先培.(2015).基于翻译模型的查询会话检测方法研究.中文信息学报,29(4),95-102. |
| MLA | 张振中,et al."基于翻译模型的查询会话检测方法研究".中文信息学报 29.4(2015):95-102. |
| 条目包含的文件 | ||||||
| 文件名称/大小 | 文献类型 | 版本类型 | 开放类型 | 使用许可 | ||
| 基于翻译模型的查询会话检测方法研究.pd(952KB) | 开放获取 | 使用许可 | 请求全文 | |||
| 个性服务 |
| 推荐该条目 |
| 保存到收藏夹 |
| 查看访问统计 |
| 导出为Endnote文件 |
| 谷歌学术 |
| 谷歌学术中相似的文章 |
| [张振中]的文章 |
| [孙乐]的文章 |
| [韩先培]的文章 |
| 百度学术 |
| 百度学术中相似的文章 |
| [张振中]的文章 |
| [孙乐]的文章 |
| [韩先培]的文章 |
| 必应学术 |
| 必应学术中相似的文章 |
| [张振中]的文章 |
| [孙乐]的文章 |
| [韩先培]的文章 |
| 相关权益政策 |
| 暂无数据 |
| 收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论