弥合网络本体语言(OWL)与关系数据库之间的差距

弥合网络本体语言(OWL)与关系数据库之间的差距

12分钟 ·
播放数1
·
评论数0

这篇文章主要探讨了Web本体语言(OWL)与关系数据库在模式处理上的差异,特别是关于完整性约束的问题。作者指出,OWL采用开放世界语义和标准的一阶逻辑语义,导致其公理无法像关系数据库中的约束那样用于检查数据的完整性,这常常引起混淆并带来性能问题。为了解决这个问题,作者提出了一种扩展的描述逻辑知识库框架,引入了类似数据库的完整性约束,并证明了在满足约束的情况下,可以显著简化查询回答过程。

以下是论文各章节的详细内容介绍:

1. 介绍

本章首先指出了OWL与关系数据库在模式语义上的根本差异。在关系数据库中,模式语句通常被解释为完整性约束,用于验证数据是否符合结构要求(如果不符则拒绝更新)。而在OWL中,类似的公理(如领域和范围约束)被解释为推理规则,用于推断新知识(例如,若一个人没有明确的社会安全号,OWL会推断其拥有一个未知的号码,而不是报错)。
作者指出,这种语义差异导致OWL无法形式化数据库式的完整性约束,既无法检查数据输入的正确性,又导致了推理过程中的性能开销。虽然已有基于自认知逻辑的研究,但它们通常不适用于模式推理。因此,本文旨在提出一种扩展方案,既能模拟数据库完整性约束的行为,又能保留OWL对层次领域建模的能力。

2. OWL与关系数据库

本章详细比较了OWL和关系数据库在多个层面上的异同:

  • 2.1 模式语言: 指出DL TBox和关系数据库模式在形式上相似,许多依赖关系都可以表示为一阶逻辑公式。
  • 2.2 模式的解释: 两者都使用一阶语义区分合法与非法结构。区别在于数据库通常要求有限模型,而OWL允许无限模型。
  • 2.3 域与类型: 讨论了数据库中的物理布局类型与DL中具体域的区别,本文简化了这两者以进行纯逻辑分析。
  • 2.4 模式推理: 无论是DL中的概念包含检测还是数据库中的查询包含检测,本质上都是检查公式在所有模型中是否成立(即蕴含问题)。
  • 2.5 查询回答: 这是关键差异点。数据库查询基于模型检测,只考虑当前给定的实例;而OWL查询基于逻辑蕴含,需考虑所有满足知识库的模型。这使得OWL类似于不完整数据库
  • 2.6 完整性约束的满足性检查: 数据库通过检查数据是否违反约束来确保完整性;而OWL的一致性检查只能检测矛盾,无法检测“信息缺失”,因此无法实现数据库式的完整性检查。
  • 2.7 讨论: 总结了开放世界语义对模式推理的重要性,以及在实际数据应用中处理完整性约束的需求。作者主张需要一种机制来控制本体中的“不完整性”。

3. OWL的完整性约束

本章提出了扩展DL知识库的形式化定义,以解决上述问题:

  • 作者定义了一个三元组知识库 $\mathcal{K} = (\mathcal{S}, \mathcal{C}, \mathcal{A})$,其中 $\mathcal{S}$ 是标准TBox(用于推理),$\mathcal{C}$ 是完整性约束TBox(用于检查),$\mathcal{A}$ 是ABox(数据)。
  • 探讨了如何定义“约束满足”。简单的蕴涵或一致性方法都不适用。作者引入了最小模型的概念来定义约束满足,即约束只需在 $\mathcal{A} \cup \mathcal{S}$ 的最小模型中被满足。
  • 通过具体例子(如BioPax本体和包含存在量词的场景),详细分析了在处理析取和存在量词时最小模型语义的合理性及其面临的挑战(如语法形式不同但逻辑等价的公理可能导致不同的约束检查结果)。

4. 查询回答

本章证明了引入完整性约束的一个重要理论优势:

  • 作者证明了如果完整性约束 $\mathcal{C}$ 在扩展知识库中被满足,那么在回答广泛的肯定类ABox查询时,可以忽略 $\mathcal{C}$,仅考虑标准TBox $\mathcal{S}$。
  • 这一结果意味着在实践中,如果数据通过了完整性检查,查询回答过程可以简化,从而显著提高性能。

5. 建模原则

本章讨论了如何在实际本体建模过程中应用完整性约束:

  • 作者分析了哪些类型的公理通常适合被指定为完整性约束(如某些领域和范围约束、函数性质等)。
  • 探讨了建模者在设计本体时应如何根据应用需求区分“推理规则”和“约束检查”。

6. 逻辑程序设计

本章提供了另一种解释完整性约束满足的方法:

  • 将问题嵌入到逻辑程序设计中,利用这种转换来进一步阐释最小模型语义的直觉含义。
  • 这也为开发实际的决策过程奠定了基础,特别是对于那些不包含存在量词的知识库。

7. 算法

本章提出了针对不同类型知识库的完整性约束满足性检查算法:

  • 对于不包含正存在量词的知识库,可以直接利用现有的逻辑程序机制(如补全和模型检查)来进行检查。
  • 对于包含存在量词的更复杂知识库,作者将问题嵌入到无限k元树上的单子二阶逻辑(SkS)中。作者指出这种方法主要证明了该问题的可判定性,虽然直接实施可能不切实际,但暗示了存在更高效算法的可能性。

8. 相关工作

本章讨论了本文提出的方法与现有的完整性约束建模方法(如基于非单调逻辑、封闭世界假设或规则扩展的方法)之间的关系,分析了各自优缺点,进一步凸显了本文方法在兼顾模式推理和数据约束方面的优势。

结论

文章总结认为,通过引入基于最小模型语义的完整性约束,OWL可以在保持其强大建模能力的同时,更好地支持数据密集型应用,解决长期存在的语义混淆和性能问题。