XMLITeye - 娱乐之横扫全球

XMLITeye

2019年02月21日11时38分30秒 | 作者: 青亦 | 标签: 数据,运用,文档 | 浏览: 1520

XML(Extensible Markup Language)即可扩展符号言语,它与HTML相同,都是SGML(Standard Generalized Markup Language,规范通用符号言语)。Xml是Internet环境中跨渠道的,依赖于内容的技能,是当时处理结构化文档信息的有力东西。扩展符号言语XML是一种简略的数据存储言语,运用一系列简略的符号描绘数据,而这些符号能够用便利的办法树立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极端简略易于掌握和运用。
XML实例
?xml version="1.0" encoding="ISO-8859-1"? bookstore book id="No1" title An Introduction to XML /title author Chunbin /author year 2010 /year price 98.0 /price /book book id="No2" title The Performance of DataBase /title author John /author year 1996 /year price 56.0 /price /book /bookstore 上面的XML文档对应的树形结构如下:  

修改本段特性
XML与Access,Oracle和SQL Server等数据库不同,数据库供给了更强有力的数据存储和剖析才干,例如:数据索引、排序、查找、相关共同性等,XML只是是展现数据。事实上XML与其他数据体现办法最大的不同是:它极端简略。这是一个看上去有点屑细的长处,但正是这点使XML异乎寻常。 XML与HTML的规划区别是:XML是用来存储数据的,重在数据自身。而HTML是用来界说数据的,重在数据的闪现办法。 XML的简略使其易于在任何运用程序中读写数据,这使XML很快成为数据交流的仅有公共言语,虽然不同的运用软件也支撑其它的数据交流格局,但不久之后他们都将支撑XML,那就意味着程序能够更简略的与Windows、Mac OS, Linux以及其他渠道下发生的信息结合,然后能够很简略加载XML数据到程序中并剖析他,并以XML格局输出成果。 为了使得SGML显得用户友爱,XML从头界说了SGML的一些内部值和参数,去掉了许多的很少用到的功用,这些冗杂的功用使得SGML在规划网站时显得杂乱化。XML保留了SGML的结构化功用,这样就使得网站规划者能够界说自己的文档类型,XML一起也推出一种新式文档类型,使得开发者也能够不用界说文档类型。 由于XML是W3C拟定的,XML的规范化作业由W3C的XML作业组担任,该小组成员由来自各个当地和职业的专家组成,他们经过email沟通对XML规范的定见,并提出自己的观点 (www.w3.org/TR/WD-xml)。由于XML 是个公共格局, (它不专归于任何一家公司),你不用忧虑XML技能会成为少量公司的盈余东西,XML不是一个依附于特定浏览器的言语 XML英文解说 The Extensible Markup Language (XML) is a general-purpose specification for creating custom markup languages.It is classified as an extensible language, because it allows the user to define the mark-up elements. XMLs purpose is to aid information systems in sharing structured data, especially via the Internet, to encode documents, and to serialize data; in the last context, it compares with text-based serialization languages such as JSON and YAML.XML began as a simplified subset of the Standard Generalized Markup Language (SGML), meant to be readable by people via semantic constraints; application languages can be implemented in XML. These include XHTML,RSS, MathML, GraphML, Scalable Vector Graphics, MusicXML, and others. Moreover, XML is sometimes used as the specification language for such application languages.XML is recommended by the World Wide Web Consortium (W3C). It is a fee-free open standard. The recommendation specifies lexical grammar and parsing requirements.
修改本段XML前史
XML是从1996年开端有其雏形,并向 W3C(全球信息网联盟)提案,而在1998二月发布为W3C的规范(XML1.0)。 XML的前身是SGML(The Standard Generalized Markup Language),是自IBM从60年代就开端开展的 GML(Generalized Markup Language)规范化后的称号。 GML的重要概念: 文件中能够清晰的将标明与内容区隔;一切文件的标签运用办法均共同. 1978年,ANSI将GML加以收拾规范,发布成为SGML,1986年起为 ISO 所选用(ISO 8879),而且被广泛地运用在各种大型的文件方案中,可是SGML是一种十分谨慎的文件描绘法,导致过于巨大杂乱(规范手册就有500多页),难以了解和学习,进而影响其推行与运用。 所以,人们对SGML进行了简化衍生出 HTML。HTML 简略,在初期没有任何界说文档外观的相关办法,仅用来在浏览器里闪现网页文件。然后,跟着因特网的开展,人们为了操控其文件款式,扩大了描绘怎么闪现数据的卷标。在 Netscape 与 Microsoft 之间的浏览器大战后, HTML 规范权威性遭受严重的检测,所幸,到了HTML 4.0时,W3C 又康复了其方位。 一起W3C意识到HTML的准则: 不能处理一切解说数据的问题 - 像是影音文件或化学公式、音乐符号等其它型态的内容。 效能问题 - 需求下载整份文件,才干开端对文件做搜索的动作。 扩大性、弹性、易读性均欠安。 为了处理以上问题,专家们运用SGML精简制造,并依照HTML的开展经历,发生出一套运用上规矩谨慎,可是简略的描绘数据言语:XML。 XML是在一个这样的布景下诞生的——是不是能有一个更中立的办法,让消费端自行决定要怎么消化、呈现从服务端所供给的信息? XML被广泛用来作为跨渠道之间交互数据的办法,首要针对数据的内容,经过不同的格局化描绘手法(XSLT,CSS等)能够完结终究的办法表达(生成对应的HTML,PDF或许其他的文件格局)。 而XML意图即在于供给一个对信息能够做精准描绘的机制,藉以补偿 HTML 太过于体现导向的特质。
修改本段效果
丰厚文件(Rich Documents)- 自定文件描绘并使其更丰厚 归于文件为主的XML技能运用 符号是用来界说一块数据应该怎么呈现 解说数据(Metadata)- 描绘其它文件或在线信息 归于数据为主的XML技能运用 符号是用来阐明一块材料的含义 组态档案(Configuration Files)- 描绘软件的组态参数
修改本段简明语法
SGML常用来界说针对HTML的文档类型界说(DTD),一起它也常用于编写XML的DTD。SGML的问题就在于,它答应呈现一些古怪的语法,这让创立HTML的解析器成为一个大难题: 1 某些开端标签不答应呈现完毕标签,例如HTML中 img 标签。包括了完毕标签就会呈现过错。 2 某些开端标签能够选择性呈现完毕标签或许隐含了完毕标签 3 某些开端标签要求有必要呈现完毕标签,例如HTML中 script 标签。 4 标签能够以任何次序嵌套。即便完毕标签不依照开端标签的逆序呈现也是答应的,例如,This is a sample string是正确的。 5 某些特性要求有必要包括值,例如 img src="picture.jpg" 中的src特性。 6 某些特性不要求必定有值,例如中的nowrap特性。 7 界说特性的两头有没有加上双引号都是能够的,所以 img src="picture.jpg" 和 img src=picture.jpg 都是答应的。 这些问题使树立一个SGML言语的解析器变成了一项艰巨的使命。判别何时运用以上规矩的困难导致了SGML言语的界说一向停滞不前。以这些问题作为起点,XML逐步步入咱们的视界。 XML去掉了之前令许多开发人员头疼的SGML的随意语法。在XML中,选用了如下的语法: 1 任何的开端标签都有必要有一个完毕标签。 2 能够选用另一种简化语法,能够在一个标签中一起表明开端和完毕标签。这种语法是在大于符号之前紧跟一个斜线(/),例如 tag / 。XML解析器会将其翻译成 tag /tag 。 3 标签有必要按适宜的次序进行嵌套,所以完毕标签有必要按镜像次序匹配开端标签,例如this is a samplestring。这好比是将开端和完毕标签看作是数学中的左右括号:在没有封闭一切的内部括号之前,是不能封闭外面的括号的。 4 一切的特性都有必要有值。 5 一切的特性都有必要在值的周围加上双引号。 这些规矩使得开发一个XML解析器要简洁得多,而且也除掉了解析SGML中花在判别何时何地运用那些古怪语法规矩上的作业。只是在XML呈现后的前六年就衍生出多种不同的言语,包括MathML、SVG、RDF、RSS、SOAP、XSLT、XSL-FO,而一起也将HTML改善为XHTML。 假如需求关于SGML和XML详细技能上的比照,请检查W3C的注解,坐落:http:///TR/NOTE-sgml-xml.html 现在,XML现已是世界上开展最快的技能之一。它的首要意图是运用文本以结构化的办法来表明数据。在某些方面,XML文件也类似于数据库,供给数据的结构化视图。这里是一个XML文件的比方:  

修改本段文档结构
每个XML文档都由XML序文开端,在前面的代码中的榜首行就是XML序文, ?xml version="1.0"? 。这一行代码会通知解析器和浏览器,这个文件应该依照前面讨论过的XML规矩进行解析。第二行代码, books ,则是文档元素(document element),它是文件中最外面的标签(咱们以为元素(element)是开端标签和完毕标签之间的内容)。一切其他的标签有必要包括在这个标签之内来组成一个有用的XML文件。XML文件的第二行并不必定要包括文档元素;假如有注释或许其他内容,文档元素能够迟些呈现。 典范文件中的第三行代码是注释,你会发现它与HTML中运用的注释风格是相同的。这是XML从SGML中承继的语法元素之一。 页面再往下的一些当地,能够发现 desc 标签里有一些特其他语法。 ![CDATA[ ]] 代码用于表明无需进行解析的文本,答应比方大于号和小于号之类的特别字符包括在文本中,而无需忧虑损坏XML的语法。文本有必要呈现在 ![CDATA[和]] 之间才干适宜地防止被解析。这样的文本称为Character Data Section,简称CData Section。  XML 文档结构
下面的一行就是在第二本书的界说之前的: ?page render multiple authors ? 虽然它看上去很像XML序文,但实际上是一种称为处理指令(processing instruction)的不同类型的语法。处理指令(以下简称PI)的意图是为了给处理页面的程序(例如XML解析器)供给额定的信息。PI通常情况下是没有固定格局的,仅有的要求是紧随榜首个问号有必要至少有一个字母。在此之后,PI能够包括除了小于号和大于号之外的任何字符串序列。
修改本段XML文档有用性
结构杰出的XML文档 假如某个文档契合XML语法规范,那么咱们就说这个文档是“结构杰出”的文档。运用本书讲到的XMLSpy 2006东西就能够测验某文档是否为结构杰出的XML文档。 有用的XML文档 所谓有用的XML文档是指经过了DTD的验证的,具有杰出结构的XML文档,在此咱们要理解XML文档可分为结构杰出的XML文档和有用的XML文档,以及他们之间的联络。即具有结构杰出的XML文档并不必定就是有用的XML文档,反之一个有用的XML文档必定是一个结构杰出的XML文档。 XML文档的解析办法 当时有两种解析办法: dtd (文档类型界说)和schema ( XML 办法) DTD实际上能够看作一个或多个XML文件的模板,这些XML文件中的元素、元素的特点、元素的摆放办法/次序、元素能够包括的内容等,都有必要契合DTD中的界说。 DTD的分类: DTD可所以一个彻底独立的文件,也能够在XML文件中直接设定。所以,DTD分为外部DTD(在XML文件中调用其他现已修改好的DTD)和内部DTD(在XML文件中直接设定DTD)两种。比方,有几十家彼此联络的、协作伙伴联络的公司、厂商,他们彼此之间的交流电子文档都是用XML文档。那么咱们能够将这些XML文档的DTD放在某个当地,让一切交流的XML文档都运用此DTD,这是最便利的做法,一起也适用于公司内部的XML文件运用。 XML Schema是以XML言语为根底的,它用于可代替DTD。 一份XML schema文件描绘了XML文档的结构。 XML Schema言语也被称为XML Schema Definition (XSD)(XML Schema界说)咱们以为XML Schema很快就会代替DTD在大多数的网络运用程序中被广泛运用。 XML Schema针对将来的额定内容是可扩展的 ; XML Schema内容比DTD丰厚,效果也更大 ; XML Schema是以XML言语编写而成的 ; XML Schema支撑数据类型 ; XML Schema支撑称号空间(namespaces);XML Schema于2001年成为W3C引荐运用的规范,在W3C 教程中你能阅览到更多关于XML Schema规范。
修改本段XML文档对网站的重要性
《互联网论坛录入敞开协议》是搜索引擎拟定的网站内容录入规范,可在网站根目录制造成遵从此敞开协议的XML格局的网页供搜索引擎索引,将网页信息主动、及时地奉告各大搜索引擎。 选用了《互联网论坛录入敞开协议》,就相当于网页被搜索引擎订阅,经过搜索引擎渠道,网民将有或许在更大范围内更高频率地拜访到您的网站,进而为您的网站带来潜在的流量。 以百度搜索引擎为例,将制造好的XML文件命名为sitemap_baidu.xml上传到您网站根目录下,并保证文件地点的url地址能够被百度spider正常拜访。例如,网站为post.baidu.com,则将xml文件上传至post.baidu.com/sitemap_baidu.xml 当百度spider发现了xml文件后,会依据上面供给的参数主动对xml文件进行更新,并抓取高质量的内容。
修改本段XML和HTML的差异
XML和HTML的不同能够概括为3点: ① XML扩展性比HTML强 XML(Extensible Markup Languages)是扩展符号言语的英语缩写,他能够创立个性化的符号言语,能够称之为元言语。XML的符号言语能够自界说,这样能够供给更多的数据操作,而不像HTML相同,只能局限于按必定的格局在终端闪现出来。HTML的功用只要浏览器放入闪现和打印,只是合适静态网页的要求。 ② XML的语法比HTML严厉 由于XML的扩展性强,它需求安稳的根底规矩来支撑扩展。它的严厉规矩为: 1、开端和完毕的标签相匹配 2、嵌套标签不能彼此嵌套 3、区别巨细写 相对应XML的严厉规矩,HTML言语并没有规矩标签的肯定方位,也不区别巨细写,而这些悉数由浏览器来完结辨认和更正。 ③ XML与HTML互补
XML能够获得运用之间的相应信息,供给终端的多项处理要求,也能被其他的解析器和东西所运用,在现阶段,XML能够转化成相应的HTML,来习惯当时浏览器的需求。 XML 东西 XML假如有一个好的修改器就能够削减许多费事 1 、XML Notepad 一种软件 软件巨细: 1872 KB 软件言语: 英文 软件类别: 国外软件 / 同享版 / 字体东西 运用渠道: Win9x/NT/2000/XP/2003 微软发布的XML Notepad,这是一个简略+好用的XML阅览和修改东西,支撑多种语法闪现和数型结构摆放并供给了许多编写XML所需的东西. 2、XML Spy 3、Xeena 4、Xmetsal
修改本段注释
有些时分,希望在XML文档中参加一些用做解说的字符数据,而且希望XML处理器不对他们进行任何处理。这种类型的文本称作注释文本。在XML中,注释的办法与HTML彻底相同,运用" !"和" "将注释文本括起来,注释还有以下规矩: ·注释不能被嵌套; ·在注释文本中不能呈现字符"-"或"—"; ·不要把注释文本放在符号之中,相同不要把注释文本放在实体声明之前或实体声明中。
修改本段处理指令PI
处理指令(Processing Instruction)是用来给处理XML文档的运用程序供给信息的,XML解析器把这些信息原封不动地传给运用程序,由运用程序来解说这个指令,遵从它所供给的信息进行处理。处理指令应该遵从下面的格局: ? 处理指令名 处理指令信息? 下面是一个比方,它是描绘辞典信息的XML文档: ?xml version="1.0"encoding="UTF-8" standalone="no"? ?xml-stylesheet type="text/xsl"href="mystyle.xsl"? 辞典 词条 ?targetProgram Save:Useful Information about XML? 词目 XML /词目 解说 XML是一种可扩符号言语,它可用以规矩新的符号规矩,并依据这个规矩安排数据。 /解说 示例 !XML示例 ![CDATA[ 产品 类型 食品类 /类型 价格 80元 /价格 /产品 ]] /示例 /词条 /辞典 其间的内容, ?targetProgram Save:Useful Information about XML? 即为PI部分:将指令Save:Useful Information about XML传递给运用程序targetProgram。 处理指令很少运用,而且XML集体并不拥护运用处理指令,特别不拥护随意地运用处理指令。虽然如此,假如有满足的理由运用它,也无需犹疑。运用处理指令,正好能够运用在HTML里只能用在注释里的信息。用户对注释中的信息能否传递给运用程序没有掌握,可是处理指令必定会传递给运用程序。
修改本段XML的优势
XML 的优势有以下六个方面:
[align=left][/align]①XML能够从HTML中别离数据 经过XML,你能够在HTML文件之外存储数据。在不运用XML时,HTML用于闪现数据,数据有必要存储在 HTML文件之内;运用了XML,数据就能够存放在别离的XML文档中。这种办法能够让你集中精力去到运用 HTML做好数据的闪现和布局上,并保证数据改动时不会导致HTML文件也需求改动。这样能够便利保护页面。 XML数据相同能够以“数据岛”的办法存储在HTML页面中。你依然能够集中精力到运用HTML格局化和闪现数据上去。 ②XML用于交流数据 经过XML,咱们能够在不兼容的体系之间交流数据。在现实生活中,计算机体系和数据库体系所存储的数据有N^N种办法,关于开发者来说,最耗时间的就是在遍及网络的体系之间交流数据。把数据转换为XML格局存 储将大大削减交流数据时的杂乱性,而且还能够使得这些数据能被不同的程序读取。 ③XML和B2B 运用XML,能够在网络中交流金融信息。在不远的将来,咱们能够希望看到许多关于XML和B2B(BusinessToBusiness)的运用。XML正在成为遍及网络的商业体系之间交流金融信息所运用的首要言语。 许多与B2B有关的彻底根据XML的运用程序正在开发中。 ④XML能够用于同享数据 经过XML,纯文本文件能够用来同享数据。已然XML数据是以纯文本格局存储的,那么XML供给了一种与软件和硬件无关的同享数据办法。这样创立一个能够被不同的运用程序读取的数据文件就变得简略了。相同,咱们晋级操作体系、晋级服务器、晋级运用程序、更新浏览器就简略多了。 XML能够用于存储数据 运用XML,纯文本文件能够用来存储数据。许多的数据能够存储到XML文件中或许数据库中。运用程序能够读写和存储数据,一般的程序能够闪现数据。 ⑤XML能够充分运用数据 运用XML,你的数据能够被更多的用户运用。已然XML是与软件、硬件和运用程序无关的,所以能够使你的数据能够被更多的用户、更多的设备所运用,而不只是是根据HTML规范的浏览器哦。其他客户端和运用程序能够把你的XML文档作为数据源来处理,就像他们对待数据库相同,你的数据能够被各式各样的“阅览器”处理,这时对某些人来说是很便利的,比方瞎子或许残疾人。 ⑥XML能够用于创立新的言语 XML是WAP和WML言语的母亲。无线符号言语,用于标识运转于 手持设备上的Internet程序。
修改本段XML的层叠款式
XML要将内容和体现别离, Web缔造者需求新的办法来操控规划, 闪现和输出.。 Style sheet 是问题的答案. 现在, 有三种可用于XML的 style sheet:: Cascading Style Sheets (CSS) Extensible Style Language (XSL) Document Style Semantics and Specification Language (DSSSL).。 假如5.0版的浏览器支撑XML, XML对现有的CSS规范的支撑将会处理大部分根本的风 格和页面问题. 可是CSS关于专业出版商或许不行强壮. 所以, 另一端存在着 DSSSL, 一个在运用SGML的高端出版商中盛行的ISO (国际规范安排)规范. 可是, DSSSL是杂乱的, 它处理的打印文档办理在Web上很少有用.。 现在剩下了 Extensible Style Language (XSL), 特别为XML而写的style-sheet. XSL现在上交给了W3C作为一个提议, 它给了Web开发者和用户较HTML更多的体现灵 活性. 例如, HTML的 H2 标识符在一切浏览器上的体现是根本相同的, 可是XSL 让开发者指定他们的页面元素怎么体现 (虽然用户能够在个人设置中掩盖它).。 XSL较CSS更强壮, 由于它使Web缔造者创立能够动态改动其体现的文档.。例如, 你 能够包括这样的程序句子, "假如一个XML元素的特点为数值10, 闪现为绿色, 不然 为黑色." 或许你能够将"仅供内部运用"作为特点给一个阶段标上, 这样它在某些 情况下不会呈现. XSL被规划用于脚本言语如JavaScript。
版权声明
本文来源于网络,版权归原作者所有,其内容与观点不代表娱乐之横扫全球立场。转载文章仅为传播更有价值的信息,如采编人员采编有误或者版权原因,请与我们联系,我们核实后立即修改或删除。

猜您喜欢的文章