关键词:信息化;元数据;标准 摘要:阐述了信息资源的开发与利用在当前国家信息基础设施建设中的重要性扣紧迫性,介 绍了元数据的基本概念、主要作用以及确定元数据应遵循的标准,最后分析了XM1 语言与元 数据标准之间的关系。 Informatization and Metadata Standards FANG Qing Keywords:infonnatizat ̄on,metadata standards Abstract:Author expounds the exploitation and utilization of information resource are important and pressing in the basic information construction and meanwhile introduces essential conc ept,main function and standards about nletadata.finally analyzes the relationship between the XML antJ the nletadata standards. (二: 重:::二) 的宽带网,是用来干什么的 它的本质就是要 使人们能够最大限度地获取和利用各种各样 的信息。政府信息化也好,企业信息化也好,电 子商务、数字化图书馆也好 离开r对信息资 源的开发利用,就失去了信息化自身的价值 也就谈不上它们自身的发展 有识之{ 把信息 国民经济和社会发展“十五”规划明确提 出了以信息化带动工业化,促进我国经济结构 调整和国民经济跨越式发展的战略方针,信息 化被摆在了实现我国经济发展第三步战略目 标的关键地位。信息化作为社会进步的发展趋 势,已成为不可阻挡的潮流 无论是政府信息 化、企业信息化、教育信息化以及各行各业的 信息化,我们所面临的主要问题就是如何将信 息化落实到改造和提升各行各业生产力素质 的实处 落到推进社会进步的实处。 资源视作与自然资源、能源相提并论的第三种 国力,因此可以说,国家信息基础设施建设的 关键和核心任务是信息资源开发利用 对于它 的重要性和紧迫性,应提到相当的高度来认 识。 涉及信息资源的利用,这在我们H常生活 中已有体会,通过网络不仅能获取新闻、天气 “十 ”规划对信息基础设施本身有了一 个新的认识,这就是把信息资源的开发与利用 纳^到信息基础设施的范畴之内。我们投几千 乃至上万个亿搞网络设施建设,包括各种各样 预报和金融等服务,还能购买到各种商 和服 务。但是就信息资源的利用而占.与实际应用 尚有很大差距。其中很重要的一个因素是关于 维普资讯 http://www.cqvip.com
数据的标准与应用有很大的缺口 利用互联阿 进行更深层次的网络的用途看起来是无穷无尽 的,但它在技术方面一定需要通过对信息资源 进行统一标识、统一管理、统一命名,才能保证 信息处理的有序、有效、有用,实现信息资源的 合理应用。解决这一问韪的一个关键因素就是 实现无数据的标准化,因为元数据标准是当前 网络发展以及信息资源利用最需要的关键部 分,随着资源的无限增长,网络信息的有效管 理将越来越依赖于元数据的管理 当前在互联 网环境下元数据服务的需求也越来越明显 并 且随着互联网逐渐发展成一个采用多种应用协 议和格式的棍合型信息经济实体,这种需求将 会更加强烈。元数据不仅将成为资源发现的关 键,它还可通过建立一定的技术或商业结构,成 为有效应用资源的基础,并在各种协议之间进 行交互操作 三 丽 元数据(Metadata)也被称为是关于数据的 数据,即关于数据的内容、质量、状况和其他特 性的信息。元数据是一个较新的标准化概念, 这个概念在过去被称为数据元,从对元数据和 数据元的定义不难看出,这两个概念所描述的 对象基本是一致的。元数据是专门用来描述数 据的特征和属性的,它能用来支持电子资源的 定位、发现、评估、选择等。元数据首先描述数 据的内容和结构。例如,检索数据时,我们需要 知道数据的主要内容,因此元数据中一般包含 对数据的描述信息 在数据使用时,为了保证 数据的可比性和可靠胜,元数据应包含数据的 质量信息 在数据共享中,有些数据是有条件 共享的,元数据应包括数据的访问信息、数据的 可获得性信息、数据的访问限制等等内容 元 数据的主要作用包括: (1)有效管理和维护数据,建立数据文档, 挖掘信息资源避免因人员调动导致数据无法理 解和使用, (2)提供数据分类、内容、质量、条件、查询、 交换等方面的信息,便于用户查询和理解数 据。 (3)用来建立信息的数据目录和数据交换 中心 通过数据目录和数据交换中心等提供的 元数据内容,用户可以共享信息、维护数据结 果,以及对它们进行优化等。 (4)提供数据转换方面的信息。使用户在获 取信息的同时便可以得到元数据信息。通过 元数据,进行不同方面的科学分析和决策 元数据是使数据充分发挥作用的重要条件 之~,可用于数据文档的建立、数据发布、数据 浏览、数据转换等,对于促进数据的管理、使用 和共享有重要的作用 原始数据如果没有元数 据,就不能有效地进行管理和使用。 各行各业都可以根据自己业务的需要制定 相关的元数据标准,如地理信息系统元数据、数 字图书馆元数据、农业信息化元数据、电子政务 元数据等元数据标准都是这些领域信息资源科 学有效应用的必要前提。 元数据的标准化工作已在我国很多应用领 域得到重视,如国家地理信息系统元数据国家 标准正在制定之中,数字图书馆的元数据标准、 农业元数据标准、中国生物多样性核心元数据 标准也在相关行业的主导下,正在制定之中。相 信这些标准的制定完成和应用、必将对我国信 息资源的科学、合理、有效利用提供基础保障。 ( 塞 塑 廛 煎函磕霍) 既然元数据是关于数据的数据,如何来定 义元数据就必须遵循一定的规则 为此国际标 准化组织就数据元的规范与标准化制定_『…整 套的规则。很多国际应用领域元数据的确定都 提出遵循这套标准。这套标准共有6个部分,它 们是: Is()11179一l信息技术数据元的规范与 标准化第1部分:数据元的规范与标准化框架 ISO11 179—2信息技术数据元的规范与 维普资讯 http://www.cqvip.com
标准化第2部分:数据元的分类 ISOI1179—3信息技术数据元的规范与 标准化第3部分:数据元的基本属性 ISO11179—4信息技术数据元的规范与 标准化第4部分:数据元定义的编写规则与指 南 1SO11179—5信息技术数据无的规范与 标准化第5部分:数据元的命名和标识规则 ISO11179—6信息技术数据元的规范与 标准化第6部分:数据元的注册 目前我国已将这6项标准全部转化为国家 标准,该系列标准是指导我国元数据编制应遵 循的基本标准。在该系列标准的第3部分中将 数据元的基本属性进行了较为详尽的规定。在 该标准中规定描述一个数据元一般由以下常规 描述符来说明:名称、定义、约束、条件、最大表 征数、数据类型、最大长度、字符集 语言和备 注 其中名称、定义、约束和数据类型是确定一 项元数据的必选项。并规定了标识类、定义类、 关系类、表示类和管理类等5种数据元属性。为 了保证元数据表示的一致性,就必须按照类似 确定术语的方式,给每个元数据一个唯一的定 义 在实际应用中我们经常会遇到一个事物有 几个不同的名称,因此在标识一个元数据时还 应将其同义词加以说明。 对元数据下定义是准确表征元数据含义的 必要_[作,在该系列标准的第4部分规定r数 据定义的编写规则与指南 值得提出的是语言 词典中的术语也许有多个含义,而在元数据的 定义表示上必须是唯一的一种含义 在编制元 数据定义时,应按照GB/T10112 1999《术语 工作原则与方法》加以定义。为此在标准中规 定数据定义应: (1)具有唯一性 (2)用单数形式阐述 (3)要阐述其概念是什么,而不是其概念不 是什么 (4)用描述性的短语或句子阐述 (5)仪可使用人们普遍理解的缩略语 (6)表述中不应加入小同的数据J 定义,即 引用其他的概念 同时作为指南规定数据定义官: (1)阐述概念的基本含义 (2)准确而不含糊 (3)简练 (4)能单独成立 (5)表述中不应加入理论说明、功能-兑明、 范嗣信息或程序信息 (6)避免相互依存 (7)对相关定义使用相同的术语和相一致 的逻辑结构。 以上规定对确定数据定义都是必须要遵守 的,也是保证数据唯一的基础 对兀数据吼予标 准化的定义,对于人们正确使用元数据l’分 要,在这里仅从术语学的角度对元数据定义的 编写作了稍微详细的说明.具体怎样做才能达 到标准中规定的上述要求以及如果需要全面掌 握整个系列标准,可以详细参看6项标准 当今,XML语言作为国际标准已在电子商 务、电子政务、数字图书馆等领域广泛使用。『4 HTML一样,XML(可扩展标识语 J是通用标 识语言标准fSGML1的一个子集,它是描述网络 上的数据内容和结构的标准 尽管如此.XMI. 不象HTML,HTML仅提供r在页向f 屁 信 息的通用方法(没有上F义相关和动态功能}, XML则对数据赋予上下文相关功能,继承了 SGML的大部分功能,但其使用的技术井不十 分复杂。 为了使得SGML显得用 友好,XMI 重新 定义了SGM1 的一些内部值和参数,去掉丫大 量的很少用到的功能,这些繁杂的功能使得 SGML在设计网站时显得复杂化 XML保留 SGML的结构化功能,这样就使得网站设计者 (下特第12页) 维普资讯 http://www.cqvip.com
体系的热量: 作的功, 是体系通过边界与环境问所 繁或简,内容不尽一致.而 只能做到概括的 定性描述。而“热力学能”是从经典热力学宏 观分析体系与环境间功与热交换关系的严谨概 念,经过数学推导提出来的, 涉及 何用微 观来解释这个量,困此其意义也是明确的 前面书写正号+是指环境对体系 作功 热和功都不是体系本身的属性,不能说 体系本身含有多少热量,而是与系统的变化过 程有关的量..热和功都不是状态参数,从数学 }‘讲,热和功的微小量都不是全微分 微分 斌中 经典热力学是在大量实践经验的基础I一, 通过科学的总结、概括、简化和逻辑推理m 建 Q和 前的符号8是指微小的变化,而不是 立起来的 热学的量和 位电就是往返个过稗 中逐步提出和完善的 著名的科学家爱 斯坦 对经典热力学的一段论述“一种理论,它的前 提越简单,所涉及的事物越多,那么它的遁I— 范围就越广泛,它给人的印象就越深刻 困 此,经典热力学绐我以深刻的印象.它是仪有 这样, f +6 =0代表一个热力学状 态参数的变化,这个状态参数定义为热力学 能,符号为u r +6 是一个全微分,用 dU表示: d k 60+部r。 的具有普遍意义的物理理沦,我确信任其基奉 概念所适用的范围内,它足绝小会被推测 刘于一个过程,则表示为: △U= 【6p+6 】; 的 ”依此也町以说明“热力学能”名称的科 学性 参考文献 △U=q+ . .我 小知道热力学能的绝对值,但是可以 求出相对值。可以选定一个状态的基准点来计 算其量值 许多书中从微观角度来解释“内能”,或 [1]Einstein A Philosopher一 ̄cientisl Vol】. New York:Harper&Row Pnblishe ̄ I 959 ;i. (上接第7页1 町以定义自己的文档类型,XML同时也推出一 定的文档相联系的某行、 术浯。我们还町以使 用XMI 对任何现有的冗数据标准进}r编码、剀 为XML不依赖于任何特定类型的元数据格式, 各种技术广家的用户组织定义 广1 的无数 据标准,并不会有什么风险 换句话|兑, 口J能 把XML变成特定类型数据的专有- r 资源描 种新型文档类型,使得开发者也可以不必定义 文档类型。 XML定义了内容而不是表现形式,这是 HTML和XML的基本区别。这样,在你的浏览 器中观看XML页时,其显示格式仅仅取决于 开发者的设计 换句话说,控制XML页的输出 格式是开发者,而不是浏览器。例如,IE 4 0使 用了XML解析器,可以读入XML页,并且可以 述框架(RDF)标准,月前尚处丁建议阶段,其 目的就是把所有的元数据集中到起.这样. 数据可以被大家共享。町以看到,xMl 的应用 从XML页中提取数据,供另外的程序访问。你 可以用传统的HTML束显示数据。我们可以对 任何数据(例如颜色,名称或者地点)赋予其属 性,这种属性称为XML文档描述,或者称为元 也依赖于元数据标准,因此伴随着信息资源的 不断挖掘和利用,大量的元数据标准会随着应 用应运而生,元数据的标准化将成为未来一段 时间不可缺少的基础-性工作,不仅得到标准化 工作者重视,也会得到厂商和应用者的关注 数据。元数据也代表更抽象的概念,例如同特
因篇幅问题不能全部显示,请点此查看更多更全内容