使用 XPath 获取 XML 文档的数据

XPath 简介

XPath 是使用路径表达式快速在 XML 导航的 W3C 标准

节点类型

XPath 中有七种类型的节点: 元素、属性、文本、命名空间、处理指令、注释以及文档(跟)节点。

对于下面的 HTML

 1 <html lang="zh_CN">                     (1) (2)
 2   <head>                                (3)
 3     <title>Hello XPath</title>          (4)
 4   </head>
 5 
 6   <body>
 7     <!-- comments -->                   (5)
 8     <p>XPath</p>                        (4)
 9   </body>
10 </html>
  1. html 是文档(跟)节点

  2. lang 是属性节点

  3. headbody 是元素节点

  4. Hello XPathXPath 是文本节点

  5. <!-- comments -→ 注释节点