当前位置: > 科技>正文

什么是xml(xml究竟是什么东西有什么用啊)

2023-03-05 01:02:12 互联网 科技

DOM解析器把XML文档转化为一个包含其内容的树,特别是当开发人员只需要处理文档中所包含的部分数据时,常用的XML解析技术有哪些常用的XML解析技术有DOM,SAX,STAX等DOM:处理大型文件时其性能下降非常厉害问题由DOM树结构所造成种结构占用内存较多而且DOM必须解析文件之前把整文档装入内存,适合对XML随机访问SAX:现于DOM,SAX事件驱动型XML解析方式顺序读取XML文件需要次全部装载整文件当遇像文件开头文档结束或者标签开头与标签结束时会触发事件用户通过其回调事件写入处理代码来处理XML文件适合对XML顺序访问STAX:StreamingAPIforXML(StAX)如何解析XML文件1)DOM(JAXP Crimson解析器)         DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准,不同的应用程序所需要的xml的标签格式基本是不会完全一样的比如rss阅读器和天气预报小插件他们所需要的标签名、属性名、标签之间的层次关系都是不一样的,XML文件的第二行并不一定要包含文档元素,DOM采用建立树形结构的方式访问XML文档,然而由于使用DOM解析器的时候需要处理整个XML文档,而且很难同时访问同一个文档中的多处不同数据。

xml究竟是什么东西有什么用啊

XML是一种可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言。 它非常适合万维网传输,提供统一的方法来描述和交换独立于应用程序或供应商的结构化数据。

以下我将从几个方面带你了解XML:

(1)XML的作用:

1、丰富文件(Rich Documents)-自定文件描述并使其更丰富; 2、属于文件为主的XML技术应用;

3、标记是用来定义一块数据应该如何呈现;

4、解释数据(Metadata)-描述其它文件或在线信息;

5、属于数据为主的XML技术应用;

6、标记是用来说明一块资料的意义;

7、组态档案(Configuration Files)-描述软件的组态参数。

(2)XML的文档结构:

每个XML文档都由XML序言开始,在前面的代码中的第一行便是XML序言。这一行代码会告诉解析器和浏览器,这个文件应该按照前面讨论过的XML规则进行解析。第二行代码则是文档元素(documentelement),它是文件中最外面的标签是起始标签和结束标签之间的内容)。所有其他的标签必须包含在这个标签之内来组成一个有效的XML文件。XML文件的第二行并不一定要包含文档元素;如果有注释或者其他内容,文档元素可以迟些出现。 页面再往下的一些地方,可以发现标签里有一些特殊的语法。虽然很像XML序言,但实际上是一种称为处理指令(processinginstruction)的不同类型的语法。处理指令(以下简称PI)的目的是为了给处理页面的程序(例如XML解析器)提供额外的信息。PI通常情况下是没有固定格式的,唯一的要求是紧随第一个问号必须至少有一个字母。在此之后,PI可以包含除了小于号和大于号之外的任何字符串序列。

(3)XML的优点:

1.能使用预先定义标记。

2.定义数据的层次。

3.筛选我们只想得到的那部分数据。

4.真正做到国际化。

5.真正实现数据交互

6.可重用。

常用的XML解析技术有哪些

常用的XML解析技术有DOM,SAX,STAX等DOM:处理大型文件时其性能下降非常厉害问题由DOM树结构所造成种结构占用内存较多而且DOM必须解析文件之前把整文档装入内存,适合对XML随机访问SAX:现于DOM,SAX事件驱动型XML解析方式顺序读取XML文件需要次全部装载整文件当遇像文件开头文档结束或者标签开头与标签结束时会触发事件用户通过其回调事件写入处理代码来处理XML文件适合对XML顺序访问STAX:StreamingAPIforXML(StAX)

如何解析XML文件

1)DOM(JAXP Crimson解析器)         DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找特定信息。分析该结构通常需要加载整个文档和构造层次结构,然后才能做任何工作。由于它是基于信息层次的,因而DOM被认为是基于树或基于对象的。DOM以及广义的基于树的处理具有几个优点。首先,由于树在内存中是持久的,因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在树中上下导航,而不是像SAX那样是一次性的处理。DOM使用起来也要简单得多。

2)SAX

        SAX处理的优点非常类似于流媒体的优点。分析能够立即开始,而不是等待所有的数据被处理。而且,由于应用程序只是在读取数据时检查数据,因此不需要将数据存储在内存中。这对于大型文档来说是个巨大的优点。事实上,应用程序甚至不必解析整个文档;它可以在某个条件得到满足时停止解析。一般来说,SAX还比它的替代者DOM快许多。    选择DOM还是选择SAX? 对于需要自己编写代码来处理XML文档的开发人员来说,  选择DOM还是SAX解析模型是一个非常重要的设计决策。 DOM采用建立树形结构的方式访问XML文档,而SAX采用的事件模型。   DOM解析器把XML文档转化为一个包含其内容的树,并可以对树进行遍历。用DOM解析模型的优点是编程容易,开发人员只需要调用建树的指令,然后利用navigation APIs访问所需的树节点来完成任务。可以很容易的添加和修改树中的元素。然而由于使用DOM解析器的时候需要处理整个XML文档,所以对性能和内存的要求比较高,尤其是遇到很大的XML文件的时候。由于它的遍历能力,DOM解析器常用于XML文档需要频繁的改变的服务中。   SAX解析器采用了基于事件的模型,它在解析XML文档的时候可以触发一系列的事件,当发现给定的tag的时候,它可以激活一个回调方法,告诉该方法制定的标签已经找到。SAX对内存的要求通常会比较低,因为它让开发人员自己来决定所要处理的tag。特别是当开发人员只需要处理文档中所包含的部分数据时,SAX这种扩展能力得到了更好的体现。但用SAX解析器的时候编码工作会比较困难,而且很难同时访问同一个文档中的多处不同数据。

xml文件:  《?xml version=“1.0“ encoding=“utf-8“ ?》   《Result》     《VALUE》         《NO DATE=“2005“》A1《/NO》         《ADDR》GZ《/ADDR》     《/VALUE》     《VALUE》         《NO DATE=“2004“》A2《/NO》         《ADDR》XG《/ADDR》    《/VALUE》  《/Result》    1)DOM  import java.io.*;  import java.util.*;  import org.w3c.dom.*;  import javax.xml.parsers.*;    public class MyXMLReader{    public static void main(String arge){      long lasting =System.currentTimeMillis();     try{       File f=new File(“data_10k.xml“);      DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();      DocumentBuilder builder=factory.newDocumentBuilder();      Document doc = builder.parse(f);      NodeList nl = doc.getElementsByTagName(“VALUE“);      for (int i=0;i<nl.getLength();i++){       System.out.print(“车牌号码:“ + doc.getElementsByTagName(“NO“).item(i).getFirstChild().getNodeValue());       System.out.println(“车主地址:“ + doc.getElementsByTagName(“ADDR“).item(i).getFirstChild().getNodeValue());      }     }catch(Exception e){      e.printStackTrace();   }    2)SAX    import org.xml.sax.*;  import org.xml.sax.helpers.*;  import javax.xml.parsers.*;    public class MyXMLReader extends DefaultHandler {     java.util.Stack tags = new java.util.Stack();    public MyXMLReader() {     super();     }     public static void main(String args) {     long lasting = System.currentTimeMillis();     try {      SAXParserFactory sf = SAXParserFactory.newInstance();      SAXParser sp = sf.newSAXParser();      MyXMLReader reader = new MyXMLReader();      sp.parse(new InputSource(“data_10k.xml“), reader);     } catch (Exception e) {      e.printStackTrace();     }      System.out.println(“运行时间:“ + (System.currentTimeMillis() - lasting) + “毫秒“);}     public void characters(char ch, int start, int length) throws SAXException {     String tag = (String) tags.peek();     if (tag.equals(“NO“)) {       System.out.print(“车牌号码:“ + new String(ch, start, length));      }      if (tag.equals(“ADDR“)) {     System.out.println(“地址:“ + new String(ch, start, length));      }     }      public void startElement(String uri,String localName,String qName,Attributes attrs) {     tags.push(qName);}  }

xml是什么有什么用

1、xml一般用于各种语言、应用程序之间的数据储存、通信2、可扩展就是说里面的标签可以自己造。不再局限于别人规定好的标签名字、属性名字,而是可以自己起名字。3、没错,理论上html能做到的,xml都能做到。可是没人这么做。而且也不推荐你在该使用html的地方使用xml。理由是当前浏览器的支持原因。xml的作用是用来表现数据之间的结构关系。这种结构关系是非常重要的。xml为程序员提供了一种更通用、更有条理来储存、访问、修改数据的方法。这种通用性体现在各种语言对xml的支持都是一致的。这种条理性体现在他成对的标签与标签之间形成的层次关系。在普通的浏览器中浏览xml,基本上都是出现该xml的内容列表。但这仅仅是在浏览器中的表现情况。在其他的应用程序中,如:rss阅读器、天气预报小插件等,它们对相应的xml的解释就不一样。要注意,不同的应用程序所需要的xml的标签格式基本是不会完全一样的比如rss阅读器和天气预报小插件他们所需要的标签名、属性名、标签之间的层次关系都是不一样的。现在xml使用广泛是因为它既对程序友好(程序能很方便的生成、提取出里面的数据),也对人类友好(人类可以很方便的手写出xml)。但是冗余信息多,占用体积大也是其弊端。在没有xml的日子里,程序员想进行进程间数据传递,必须自己设计传输接口,里面牵涉到很多烦人的数据格式等问题,使得程序员不能专注于具体业务的解决。如今xml和各种语言对xml的支持包,把程序员解脱出来了。

文档

版权声明: 本站仅提供信息存储空间服务,旨在传递更多信息,不拥有所有权,不承担相关法律责任,不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本站联系的,一经查实,本站将立刻删除。