PHP - SAX 解析器示例


PHP 在 php.ini 设置文件中默认启用了 XML 解析器扩展。此解析器实现 SAX API,这是一种基于事件的解析算法。

基于事件的解析器不会在内存中加载整个 XML 文档。相反,它一次读取一个节点。解析器允许您实时交互。移动到下一个节点后,旧节点将从内存中删除。

基于 SAX 的解析机制比基于树的解析器更快。PHP 库包括用于处理 XML 事件的函数,如本章所述。

解析 XML 文档的第一步是拥有一个解析器对象,该对象具有 xml_parse_create() 函数


xml_parser_create(?string $encoding = null): XMLParser

此函数创建一个新的 XML 解析器,并返回一个 XMLParser 对象,供其他 XML 函数使用。

xml_parse() 函数开始解析 XML 文档


xml_parse(XMLParser $parser, string $data, bool $is_final = false): int

xml_parse() 解析 XML 文档。根据需要多次调用已配置事件的处理程序。

XMLParser 扩展提供了不同的事件处理程序函数。

xml_set_element_handler()

此函数设置 XML 解析器的元素处理程序函数。每当 XML 解析器遇到 start end 标记时,都会发出 Element 事件。开始标签和结束标签有单独的处理程序。


xml_set_element_handler(XMLParser $parser, callable $start_handler, 
   callable $end_handler): true

当打开新的 XML 元素时,将调用 start_handler() 函数。end_handler() 函数在关闭 XML 元素时调用。

xml_set_character_data_handler()

此函数设置 XML 解析器解析器的字符数据处理程序函数。字符数据大致是 XML 文档的所有非标记内容,包括标记之间的空格。


xml_set_character_data_handler(XMLParser $parser, callable $handler): true

xml_set_processing_instruction_handler()

此函数设置 XML 解析器解析器的处理指令 (PI) 处理程序函数。<php ?> 是一个处理指令,其中 php 称为“PI 目标”。这些操作的处理是特定于应用程序的。


xml_set_processing_instruction_handler(XMLParser $parser, callable $handler): true

处理指令具有以下格式 -


<?target
   data
?>

xml_set_default_handler()

此函数设置 XML 解析器解析器的默认处理程序函数。未进入其他处理程序的内容将进入默认处理程序。您将在默认处理程序中获得 XML 和文档类型声明等内容。


xml_set_default_handler(XMLParser $parser, callable $handler): true

以下示例演示了如何使用 SAX API 解析 XML 文档。我们将使用以下 test.xml -


<?xml version="1.0" encoding="utf-8"?>
<tutors>
   <course>
      <name>Android</name>
      <country>china</country>
      <email>contact@qikepu.com</email>
      <phone>123456789</phone>
   </course>

   <course>
      <name>Java</name>
      <country>china</country>
      <email>contact@qikepu.com</email>
      <phone>123456789</phone>
   </course>

   <course>
      <name>HTML</name>
      <country>china</country>
      <email>contact@qikepu.com</email>
      <phone>123456789</phone>
   </course>
</tutors>

例子

解析上述文档的 PHP 代码如下所示。它打开 XML 文件并调用 xml_parse() 函数,直到到达文件末尾。事件处理程序将数据存储在 tutors 数组中。然后,数组按元素回显。


<?php

   // 使用SAX(Simple API for XML)语法分析器读取XML
   $tutors   = array();
   $elements   = null;

   // 打开标签时调用此函数
   function startElements($parser, $name, $attrs) {
      global $tutors, $elements;
      if(!empty($name)) {
         if ($name == 'COURSE') {
         
            // 创建一个数组来存储信息
            $tutors []= array();
         }
         $elements = $name;
      }
   }

   // 当标签关闭时调用此函数
   function endElements($parser, $name) {
      global $elements;

      if(!empty($name)) {
         $elements = null;
      }
   }

   // 调用标签开始和结束之间的文本
   function characterData($parser, $data) {
      global $tutors, $elements;
      if(!empty($data)) {
         if ($elements == 'NAME' || $elements == 'COUNTRY' ||  $elements == 'EMAIL' ||  $elements == 'PHONE') {
            $tutors[count($tutors)-1][$elements] = trim($data);
         }
      }
   }

   $parser = xml_parser_create();
   xml_set_element_handler($parser, "startElements", "endElements");
   xml_set_character_data_handler($parser, "characterData");

   // 打开xml文件
   if (!($handle = fopen('test.xml', "r"))) {
      die("无法打开XML输入");
   }

   while($data = fread($handle, 4096)) {
      xml_parse($parser, $data);  
   }

   xml_parser_free($parser); 
   $i = 1;

   foreach($tutors as $course) {
      echo "course No - ".$i. '<br/>';
      echo "course Name - ".$course['NAME'].'<br/>';
      echo "Country - ".$course['COUNTRY'].'<br/>';
      echo "Email - ".$course['EMAIL'].'<br/>';
      echo "Phone - ".$course['PHONE'].'<hr/>'; 
      $i++; 
   }
?>

上面的代码给出了以下输出 -

php sax parser 示例