XML(可扩展标记语言)用于描述数据。XML 标准是一种通过公共互联网以及企业网络创建信息格式和以电子方式共享结构化数据的灵活方式。
XML 是一种基于标准通用标记语言 ( SGML ) 的标记语言,用于定义标记语言。
XML 的主要功能是为用于对文档、数据库记录、事务和许多其他类型数据的信息进行编码的数据创建格式。XML 数据可用于创建不同的内容类型,这些内容类型是通过构建基于 XML 数据的不同类型的内容(包括 Web、印刷和移动内容)而生成的。
与同样基于 SGML 标准的超文本标记语言 ( HTML ) 一样,XML 文档存储为美国信息交换标准代码 ( ASCII ) 文件,并且可以使用任何文本编辑器进行编辑。
根据万维网联盟(W3C) 的说法, XML 的主要功能是提供“用于表示结构化信息的简单的基于文本的格式” ,包括以下内容:
Microsoft Office 等应用程序的基础数据格式;
技术文档;
应用软件的配置选项;
图书;
交易;和
发票。
XML 允许在以下对象之间共享结构化信息:
程序和程序;
程序和人员;和
本地和跨网络。
W3C 定义了 XML 标准并建议将其用于 Web 内容。虽然 XML 和 HTML 都基于 SGML 平台,但 W3C 还定义了 XHTML 和 XHTLM5 文档格式,它们分别反映了 Web 内容的 HTML 和HTML5标准。
XML 通过提供可预测的数据格式来工作。XML 对格式有严格要求;如果格式关闭,处理或显示编码数据的程序将返回错误。
要使 XML 文档被认为是格式良好的(即符合 XML语法并能够被 XML 解析器读取和理解),它必须是有效的 XML 代码。所有 XML 文档都由元素组成;元素充当数据的容器。元素的开始和结束由开始和结束标记标识,其中包含其他元素或纯数据。
XML 通过提供格式正确的数据来工作,这些数据可以被设计用于处理 XML 输入的程序可靠地处理。例如,技术文档可能包含一个元素,类似于以下 XML 代码片段中所示的元素:
<warning>
<para>
<emphasis type="bold">可能导致严重伤害</emphasis>
请格外小心,因为如果不采取预防措施,此过程可能会导致严重伤害或死亡。
</para>
</警告>
在此示例中,根据技术文档的形式,以不同方式解释和显示此数据。在网页上,此元素可以通过以下方式显示:
相同的 XML 代码在设备用户界面 (UI) 或打印中呈现不同的方式。该元素可以解释为以不同方式显示标记为强调的文本,例如使其显示为红色并带有闪烁的高亮显示。在印刷形式中,内容可能以不同的字体和格式提供。
XML 文档不定义表示,并且没有默认的 XML 标记。大多数 XML 应用程序使用不同的预定义标记集,具体取决于 XML 格式。大多数用户依赖预定义的 XML 格式来编写他们的文档,但用户也可以根据需要定义额外的 XML 元素。
以下是一个简单 XML 文件的示例:
<?xml version="1.0" encoding="UTF-8"?>
<library>
<book>
<title>The Fire Next Time</title>
<author>Baldwin, James</author>
</book>
<book >
<title>挚爱</title>
<author>莫里斯,托尼</author>
</book>
<book>
<title>斯德哥尔摩的弥赛亚</title>
<author>奥齐克,辛西娅</author>
</book >
</库>
此示例中的第一行称为XML 序言或XML 声明,指定正在使用的 XML 版本以及字符编码方案。此声明(如果存在)必须是文件的第一行。
序言指定文件包含 XML 版本 1.0 数据,使用 Unicode 转换格式 8 (UTF-8) 编码进行编码,与 ASCII 文本相同,并指定美式英语字符集。不同的语言字符集可以使用不同的字符编码,但所有 XML 文件都必须由Unicode字符组成。任何 Unicode 字符都可以在 XML 文件中使用带有以下格式的字符串的数字字符引用来表示:
&#xXXXX;
在此格式中,字母“XXXX”将替换为有效的十六进制Unicode 数字代码。
XML 文件的逻辑结构要求文件中的所有数据都封装在称为根元素或文档元素的 XML 元素中。该元素标识文件中包含的数据类型;在上面的示例中,根元素是<library>。
根元素包含定义 XML 文档不同部分的其他元素;在上面的示例中,根元素包含<book>元素,而这些元素又由<title>和<author>两个元素组成。
所有 XML 元素都必须正确终止,以便将 XML 文件视为格式正确。这意味着必须使用开始和结束标记正确终止标记,例如将成为文档一部分的段落元素:
<para>这是一个段落的 XML 标记示例。</para>
标记也可以为空,在这种情况下,它以正斜杠终止。在这个例子中,一个空的自终止段落标签用于在文档中插入一个额外的空间:
<para />
XML 使用户能够在需要时定义自己的附加元素。在前面的示例中,XML 作者可以为出版商、出版日期、国际标准书号和任何其他相关数据定义新元素。还可以定义元素以强制执行有关元素内容的规则。
XML 不是一种编程语言。但是,作为一种标记语言,它用于使用标签来注释数据,标签解释该数据。编程语言由实现算法的指令组成,而标记语言用于格式化数据,以供运行解释标记数据的算法的程序处理。
标记语言标签被认为是一种计算机代码,因为它们定义了标记语言的不同元素,并且对于如何组合这些元素有严格的语法规则。
XML 文件是具有 .xml 文件扩展名的纯文本文件。XML 文件包含 Unicode 文本,可以使用任何能够读取文本文件的应用程序打开它们。
XML 文件可以使用简单的文本编辑器或专门的 XML 编辑器进行编辑。XML 编辑器可能包括用于验证 XML 代码的工具,包括执行以下操作的能力:
解析 XML 代码并显示格式良好的 XML;
标记孤立文本,即未包含在标签内的文本;和
识别格式不正确的标签。
可以将不同类型的内容合并到 XML 文件中。例如,可以通过标识富媒体内容所在文件的标签将富媒体内容合并到 XML 中。
你适合学Java吗?4大专业测评方法
代码逻辑 吸收能力 技术学习能力 综合素质
先测评确定适合在学习