中国科学院软件研究所机构知识库
Advanced  
ISCAS OpenIR  > 软件工程技术研究开发中心  > 学位论文
题名:
关系数据库语义集成关键技术研究
作者: 刘强
答辩日期: 2008-06-02
导师: 黄涛
专业: 计算机软件与理论
授予单位: 中国科学院研究生院
授予地点: 中国科学院软件研究所
学位: 博士
关键词: 关系数据库 ; 本体 ; 语义互操作 ; 模式匹配 ; 冲突消解 ; 语义查询
其他题名: Semantic Integration of Relational Databases
部门归属: 软件工程技术研究开发中心
摘要: 自上世纪70年代关系数据库诞生以来,数据集成就一直是数据库领域的研究热点和难点问题。传统的数据集成研究依赖于元数据级别的模式映射和模式转换技术,较好地解决了结构级别的异构。但是,随着电子商务等web应用的出现,数据集成参与方的规模越来越大,而关系数据库模式缺乏对语义信息的显式表达能力,用户依赖于约定俗成规定数据语义的方式不再成为可能。这就造成了几个方面的问题:如何提高集成过程的自动化程度,如何保证数据集成满足用户定义的准确性要求,如何检测和消解集成过程中的语义冲突,如何提供满足用户意图的查询结果?因此,迫切需要能够克服这些困难的新方法。随着对语义web技术的深入研究和本体在数据集成领域的逐步应用,利用或基于本体解决语义互操作问题已成为可能。本文以本体为主要工具,在传统的模式匹配和模式冲突消解技术的基础上,深入研究语义级别的自动化模式匹配技术、检测和消解关系数据库集成中的语义冲突、提高数据库查询的质量。本文对关键数据模型进行定义,描述了复杂过程的规则和算法,设计了系统体系结构,并在数据集成中间件OnceDI的基础上进行了实现,研究内容可满足网络分布式环境下关系数据库语义互操作的需求,在集成准确性、自动化程度和响应质量上均得到了较好的结果。在模式匹配方面,利用WordNet本体与决策树学习相结合的方法进行属性名称匹配,这种方法基于词汇语义,区别于已有的基于模式的、基于实例的和基于结构的方法。在此基础上,根据自主构建的数据类型本体,计算数据类型的语义距离,进一步得出集成了数据类型的属性相似度。利用领域本体,还可以计算一对多的语义匹配关系。迭代的三个过程逐步提高了模式匹配的质量。在冲突检测和消解方面,首先给出了一种语义冲突的分类框架,基于该框架建立了冲突分类本体SCO。然后使用OWL本体描述语言建立关系数据库模式的语义扩展模型ESM,并给出了一种基于规则的关系数据库到ESM的自动转换方法。SCO和ESM两部分构成了语义冲突的表示模型,在此基础上,给出了语义冲突检测和消解的算法。系统实现证明,它可以有效消解大部分实际应用中的语义冲突,并且保持领域通用性和集成模型无关性。在数据库语义查询方面,已有的研究主要解决多数据库模式级别的语义异构问题,满足用户全局查询的目的。考虑数据库实例的语义,并用来提高数据库查询质量的研究尚不多见。我们定义了与数据库相关的本体,主要描述数据库实例的语义及关系,基于该本体与数据库元素的映射关系,根据语义关系的等价性,定义了查询转换的规则,应用该规则可以获取更多或者更少的查询结果,但是却更能反映用户的查询意图。本文给出了查询转换规则的正确性证明方法,并讨论了查询转换的实现。基于转换规则的方法不要求用户熟悉本体语义,不需要对DBMS进行修改和扩充,具有对所有关系数据库类型的通用性,较好地满足了提高数据库查询质量的要求。最后,本文介绍了如何在数据集成中间件OnceDI中实现语义集成的功能。我们扩展了客户端工具集,用于编辑处理各种本体;在控制中心服务器中,扩充了元数据管理功能,可以在此基础上自动生成等价的关系数据源本体,扩展了ETLJob管理模块,用于完成基于各种语法和语义匹配算法的自动化模式匹配;在集成服务器中,实现了转换函数库,用于属性冲突的消解处理。本文介绍了OnceDI的各个重要组成部分,阐释了语义集成功能的实现细节,给出了关键数据模型的数据结构,描述了复杂过程的执行流程。
内容类型: 学位论文
URI标识: http://ir.iscas.ac.cn/handle/311060/6670
Appears in Collections:软件工程技术研究开发中心 _学位论文

Files in This Item:
File Name/ File Size Content Type Version Access License
10001_200318015003093刘强_paper.pdf(1882KB)----限制开放-- 联系获取全文

Recommended Citation:
刘强. 关系数据库语义集成关键技术研究[D]. 中国科学院软件研究所. 中国科学院研究生院. 2008-06-02.
Service
Recommend this item
Sava as my favorate item
Show this item's statistics
Export Endnote File
Google Scholar
Similar articles in Google Scholar
[刘强]'s Articles
CSDL cross search
Similar articles in CSDL Cross Search
[刘强]‘s Articles
Related Copyright Policies
Null
Social Bookmarking
Add to CiteULike Add to Connotea Add to Del.icio.us Add to Digg Add to Reddit
所有评论 (0)
暂无评论
 
评注功能仅针对注册用户开放,请您登录
您对该条目有什么异议,请填写以下表单,管理员会尽快联系您。
内 容:
Email:  *
单位:
验证码:   刷新
您在IR的使用过程中有什么好的想法或者建议可以反馈给我们。
标 题:
 *
内 容:
Email:  *
验证码:   刷新

Items in IR are protected by copyright, with all rights reserved, unless otherwise indicated.

 

 

Valid XHTML 1.0!
Copyright © 2007-2017  中国科学院软件研究所 - Feedback
Powered by CSpace