都柏林核心应用纲要的新加坡框架

创建者:Mikael Nilsson(KMR Group,CSC,KTH (Royal Institute of Technology),Sweden)

创建者:Thomas Baker (DCMI)

创建者:Pete Johnston (EduservFoundation)

翻译者:赵亮 (上海图书馆)

标识符:http://dublincore.org/documents/2008/01/14/singapore-framework/

发布日期:2008-01-14

替代:   无

最新版本:http://dublincore.org/documents/singapore-framework/

文档描述:本文档描述了都柏林核心应用纲要的新加坡框架,此框架于2007年9月,在新加坡召开的都柏林核心与元数据应用的国际会议上提出。此文档的目的是为新加坡框架提供较稳定的可被引用的参考点。

1.介绍

DC元数据应用纲要的新加坡框架是设计元数据应用的框架,以帮助设计的元数据获得最大程度的互操作性,同时通过这一框架使这样的设计文档尽可能被重用。新加坡框架定义了一系列描述组件,描述了这些描述组件所依据的标准规范与标准应用的领域模型及语义万维网的基础标准之间的关系,这些描述组件对于一个应用纲要或是必须的或者是有用的。新加坡框架提供了一个供元数据应用纲要(Application Profiles)检验在文档上的完整性以及是否遵循万维网结构标准(相关规范)的基础。

本文档仅提供了新加坡框架的摘要信息。我们计划未来提供一些文档来提供必要的文档创建指南。

  1. 背景

术语纲要(profile)一般指的是一个描述标准或一些特定规范是如何被运用以支持特定的应用、功能、行业需求或特定环境的文档。在元数据行业领域,术语应用纲要(application profile)也被用于指描述剪裁现有标准以适用特定应用的文档。

2005年3月作为DCMI推荐方案发布的DCMI抽象模型,提出了一种可供计算机处理的应用纲要的形式化要求的元数据模型。2007年9月,Mikael Nilsson在新加坡举行的名为“DC和元数据应用”的国际会议上,提出了一个用于定义DC应用纲要的框架,这一框架被定名为“新加坡框架”。

  1. 新加坡框架

3.1 DC应用纲要的定义

制定一个“纲要”的过程,是在以下两个方面取得平衡的过程,一方面既要满足特定行业或服务的环境特性、效率以及本地化的需求,另一方面也要满足在不同行业或服务之间的互操作性。不同的元数据标准可能提供不同程度的灵活性,比如一些元数据标准归定得很死,相对来说可供定制的选项很少,而另一些则可能具有许多可选项,在实施时提供相当大程度上的选择与裁减的可能性。

理想的方式是既可以直接利用各行业或者领域的元数据标准,也可以利用这些元数据标准中部件的组合。在元数据标准的应用中应该能够通过这些部件的组合来满足一些特定的功能组合。这种模式意味着理论上我们可以处理从不同的专门定义的元数据标准所借用的各种部件。这些部件组合的集合也应该可以被独立设计的应用正确解析。我们可以用乐高(Lego)积木作比喻来说明这个过程:一个应用设计者可以选择来自于不同元数据标准提供的“工具箱”中的“安装部件”,并把它们装配到一起,以满足设计者的需求。而这些提供“安装部件”的“工具箱”很有可能是分别独立制造出来的。

在DC应用纲要中(DCAP),大家期望术语被看作是由DCMI抽象模型所描述的类型,也就是说,DCAP描述了在某些类别的元数据描述中需要用到哪些属性(properties)以及这些属性是被如何应用的,例如它们使用时也有可能被指定一些词汇编码体系(vocabulary encoding schemes)修饰词与句法编码体系修饰词(syntax encoding schemes.)。以DC的观念来看,应用纲要并不会对这些属性或编码体系是如何定义管理的加上任何限制,不管它们是被DCMI或是任何其他机构管理的。在DCAP中,最主要的要求是这些应用的属性应该与资源描述框架(RDF)所定义的属性(property)类别兼容。

在DC抽象模型中,每个DC元数据描述中所引用的术语都必须用URI来指向。一旦术语是用URI来标识的话,不管它是来自哪里,都可以避免在定义上的两义性。这样一个术语集合可以被看作是应用纲要被应用的行业或应用的一个“词汇表”。这个词汇表中的术语同样也可以被用于其他许多DCAP中。

我们必须认识到在应用纲要中的术语的语义是由它们的原始定义决定的,这个与它应用在什么应用纲要中无关,这一点很重要。因为语义互操作能力的要求是跨越单个应用纲要的边界,而要在多个应用纲要之间实现的。一个应用纲要描述了一系列应用指南、描述规则以及创建具体的元数据记录时的各种约定。如果我们在单个或多个词汇表中对术语的正确使用就保证了语义层面的互操作能力,而应用纲要需要能够提供语义互操作能力以外的语法与结构上的互操作能力。

3.2 DC应用纲要的组成部分

根据新加坡框架的定义,一个DC元数据应用纲要由包括以下部分的文档组合而成:

  • 功能需求 (必备)

DC应用纲要的功能需求定义了应用纲要所需要支持完成的设计功能,以及其他一些功能需求。

功能需求是评价应用纲要内部一致性的基础,并且给出对应指定需求时的应用纲要应用指南。

  • 领域模型 (必备)

领域模型定义了应用纲要所描述的基本实体概念以及它们之间主要的相互关系。领域模型的目的就是要定义应用纲要的基本范围。

领域模型既可以就用文本描述,也可以采用象UML这样更为规范的描述方法。

  • 描述集合纲要 (DSP) (必备)

一个描述集合纲要(Description Set Profile,缩写为DSP,参见[DSP])定义了作为合法的描述应用纲要实例的元数据记录集合. 目前,描述集合纲要(DSP)正由DCMI的DC架构工作组来做进一步的制订,并且已进入作为DCMI工作组草案推出的进程中。<br>

在DCMI抽象模型的基础上,DC描述集合纲要的设计目标是提供一种简单的约束元数据记录描述的语言。一个描述集合纲要(DSP)约定了根据应用纲要的要求,哪些资源是可以被描述的,可以使用哪些属性来描述,以及我们可以用何种方式来关联属性值。<br>

  • 应用指南 (可选)

这个可选的应用指南描述了应用纲要是如何被应用的,以及那些使用的属性是如何在应用环境中被用到等等。<br>

  • 编码句法指南(可选)

如果存在任何应用纲要特定的句法或句法指南的话,这个可选的编码句法指南文档就是用来描述这些内容的。<br>

这个完整的模型也可以用以下的图示来说明:<br>

[[Image:Sframe.jpg]]

3.3 领域标准与基础标准

上面的图示展现了DC应用纲要与“领域标准”(指的是那些在各个行业中广泛使用的模型与标准)以及与W3C标准RDF之间的关系,后面正是目前计算机处理语义的基础标准。

描述集合纲要(DSP)是以DCMI抽象模型(DCAM)为基础的,后者规定了在一个具体的元数据集合中,DCAM中的实体是如何被使用的。因此,DCAM构成了一个被广泛认同的元数据记录的结构模型。而DCAM自身完全是以RDF为基石的。

描述集合纲要通常使用在标准的元数据词表比如DCMI术语表中的属性名与类名。而元数据词表,一般是基于RDF词汇描述语言(也称为RDF Schema, 或RDFS)来描述的。

在一个应用中使用的领域模型一般是基于广泛使用的模型,比如书目记录功能需求(FRBR)就是在图书馆界描述资源时所使用的一个重要的参照模型。

对于具体的针对特定表达格式的描述集合纲要的应用指南可以参照一个或多个由DCMI出版的对使用HTML, XML, 以及RDF/XML等这些通用语言进行DC元数据描述的指南文档。

  1. 实例

因为新加坡框架仍然是一个较新的概念模型,所以目前仍没有什么稳定成熟的已经出版的完全遵循上述指南的应用纲要实例。在新加坡举行的“DC和元数据应用”的国际会议上,介绍了一个与新加坡框架模型理念同步发展的ePrints应用纲要,在这里你可以找到相应的演讲文档。这里还有一个专门的wiki页面介绍ePrints应用纲要的实验模型。

References:

DCAM: Powell, Andy, Mikael Nilsson, Ambjörn Naeve, Pete Johnston and Thomas Baker. DCMI Abstract Model. DCMI Recommendation. June 2007.<http://dublincore.org/documents/2007/06/04/abstract-model/>

DSP:Mikael Nilsson. DCMI Description Set Profile Model. Working Draft, December 2007.<http://dublincore.org/architecturewiki/DescriptionSetProfile>