DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧

这篇具有很好参考价值的文章主要介绍了DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

遍历是指通过或遍历节点树

遍历节点树

通常,您想要循环一个 XML 文档,例如:当您想要提取每个元素的值时。

这被称为"遍历节点树"。

下面的示例循环遍历所有 <book> 的子节点,并显示它们的名称和值:

<!DOCTYPE html>
<html>
<body>

<p id="demo"></p>

<script>
var x, i ,xmlDoc;
var txt = "";
var text = "<book>" +
"<title>Everyday Italian</title>" +
"<author>Giada De Laurentiis</author>" +
"<year>2005</year>" +
"</book>";

parser = new DOMParser();
xmlDoc = parser.parseFromString(text,"text/xml");

// documentElement 总是代表根节点
x = xmlDoc.documentElement.childNodes;
for (i = 0; i < x.length ;i++) {
    txt += x[i].nodeName + ": " + x[i].childNodes[0].nodeValue + "<br>";
}
document.getElementById("demo").innerHTML = txt;
</script>

</body>
</html>

输出:

title: Everyday Italian
author: Giada De Laurentiis
year: 2005

示例解释

  • 将 XML 字符串加载到 xmlDoc
  • 获取根元素的子节点
  • 对于每个子节点,输出节点名称和文本节点的节点值

浏览器中 DOM 解析的差异

浏览器之间存在一些差异。其中一个重要的差异是:

  • 它们如何处理空格和换行符

DOM - 空格和换行符

XML 经常包含节点之间的换行符或空格字符。当文档由简单编辑器(如记事本)编辑时,通常会出现这种情况。

以下示例(由记事本编辑)在每行之间包含 CR/LF(换行符),并在每个子节点之前包含两个空格:

<book>
  <title>Everyday Italian</title>
  <author>Giada De Laurentiis</author>
  <year>2005</year>
  <price>30.00</price>
</book>

Internet Explorer 9 及更早版本不会将空格或换行符视为空格文本节点,而其他浏览器会。

以下示例将输出根元素(books.xml)的子节点数。IE9 及更早版本将输出 4 个子节点,而 IE10 及更高版本以及其他浏览器将输出 9 个子节点:

function myFunction(xml) {
  var xmlDoc = xml.responseXML;
  x = xmlDoc.documentElement.childNodes;
  document.getElementById("demo").innerHTML =
    "Number of child nodes: " + x.length;
}

PCDATA - 解析字符数据

XML 解析器通常解析 XML 文档中的所有文本。

当解析 XML 元素时,还会解析 XML 标签之间的文本:

<message>This text is also parsed</message>

解析器执行此操作是因为 XML 元素可以包含其他元素,如此示例中的 <name> 元素包含两个其他元素(first 和 last):

<name><first>Bill</first><last>Gates</last></name>

解析器将其拆分为子元素,如下所示:

<name>
  <first>Bill</first>
  <last>Gates</last>
</name>

解析字符数据(PCDATA)是一个用于指代将由 XML 解析器解析的文本数据的术语。

CDATA - 未解析的字符数据

术语 CDATA 用于指代 XML 解析器不应解析的文本数据。

字符如 "<" 和 "&" 在 XML 元素中是非法的。

"<" 会生成错误,因为解析器将其解释为新元素的开始。

"&" 会生成错误,因为解析器将其解释为字符实体的开始。

一些文本,比如 JavaScript 代码,包含许多 "<" 或 "&" 字符。为了避免错误,可以将脚本代码定义为 CDATA。

CDATA 部分中的所有内容都会被解析器忽略。

CDATA 部分以 "" 结束:

<script>
<![CDATA[
function matchwo(a,b) {
    if (a < b && a < 0) {
        return 1;
    } else {
        return 0;
    }
}
]]>
</script>

在上面的示例中,CDATA 部分内的所有内容都会被解析器忽略。

关于 CDATA 部分的注意事项:

  • CDATA 部分不能包含字符串 "]]>"。不允许嵌套 CDATA 部分。
  • 表示 CDATA 部分结束的 "]]>" 不能包含空格或换行符。

XML DOM - 导航节点

可以使用节点之间的关系来导航节点。

导航 DOM 节点

通过节点之间的关系在节点树中访问节点

,通常被称为"导航节点"。

在 XML DOM 中,节点关系被定义为节点的属性:

  • parentNode
  • childNodes
  • firstChild
  • lastChild
  • nextSibling
  • previousSibling

以下图像说明了 books.xml 中的节点树的一部分以及节点之间的关系:

DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧

DOM - 父节点

所有节点都有一个父节点。以下代码导航到 <book> 的父节点:

function myFunction(xml) {
var xmlDoc = xml.responseXML;
    var x = xmlDoc.getElementsByTagName("book")[0];
    document.getElementById("demo").innerHTML = x.parentNode.nodeName;
}

示例解释:

  • 将 books.xml 加载到 xmlDoc
  • 获取第一个 <book> 元素
  • 输出 "x" 的父节点的节点名称

避免空文本节点

某些浏览器可能将空白空格或换行符视为文本节点。

在使用属性如 firstChildlastChildnextSiblingpreviousSibling 时,这会导致问题。

为了避免导航到空文本节点(元素节点之间的空格和换行符),我们使用一个检查节点类型的函数:

function get_nextSibling(n) {
    var y = n.nextSibling;
    while (y.nodeType != 1) {
        y = y.nextSibling;
    }
    return y;
}

上述函数允许您使用 get_nextSibling(node) 而不是属性 node.nextSibling

代码解释:

  • 元素节点的类型为 1。如果兄弟节点不是元素节点,则移动到下一个节点,直到找到一个元素节点。
  • 获取下一个是元素节点的兄弟节点。

获取第一个子元素

以下代码显示了第一个 <book> 的第一个元素节点:

<!DOCTYPE html>
<html>
<body>

<p id="demo"></p>

<script>
var xhttp = new XMLHttpRequest();
xhttp.onreadystatechange = function() {
    if (this.readyState == 4 && this.status == 200) {
        myFunction(this);
    }
};
xhttp.open("GET", "books.xml", true);
xhttp.send();

function myFunction(xml) {
    var xmlDoc = xml.responseXML;
    var x = get_firstChild(xmlDoc.getElementsByTagName("book")[0]);
    document.getElementById("demo").innerHTML = x.nodeName;
}

// 检查第一个节点是否是元素节点
function get_firstChild(n) {
    var y = n.firstChild;
    while (y.nodeType != 1) {
        y = y.nextSibling;
    }
    return y;
}
</script>

</body>
</html>

输出:

title

示例解释

  • 将 books.xml 加载到 xmlDoc
  • 在第一个 <book> 元素节点上使用 get_firstChild 函数,获取第一个子节点,该子节点是一个元素节点
  • 输出是第一个是元素节点的子节点的节点名称

更多示例

  • lastChild(): 使用 lastChild() 方法和自定义函数获取节点的最后一个子节点。
  • nextSibling(): 使用 nextSibling() 方法和自定义函数获取节点的下一个兄弟节点。
  • previousSibling(): 使用 previousSibling() 方法和自定义函数获取节点的前一个兄弟节点。

XML DOM 获取节点值

nodeValue 属性用于获取节点的文本值。

getAttribute() 方法返回属性的值。

获取元素的值

在 DOM 中,一切都是节点。元素节点没有文本值。元素节点的文本值存储在子节点中,这个节点被称为文本节点。要检索元素的文本值,必须检索元素的文本节点的值。

getElementsByTagName 方法

getElementsByTagName() 方法按照它们在源文档中出现的顺序,返回指定标签名的所有元素的节点列表。假设 books.xml 已加载到 xmlDoc

此代码检索第一个 <title> 元素:

var x = xmlDoc.getElementsByTagName("title")[0];

childNodes 属性

childNodes 属性返回元素的所有子节点的列表。以下代码检索第一个 <title> 元素的文本节点:

x = xmlDoc.getElementsByTagName("title")[0];
y = x.childNodes[0];

nodeValue 属性

nodeValue 属性返回文本节点的文本值。以下代码检索第一个 <title> 元素的文本节点的文本值:

x = xmlDoc.getElementsByTagName("title")[0];
y = x.childNodes[0];
z = y.nodeValue;

结果在 z 中:"Everyday Italian"

完整示例

<!DOCTYPE html>
<html>
<body>

<p id="demo"></p>

<script>
var xhttp = new XMLHttpRequest();
xhttp.onreadystatechange = function() {
    if (this.readyState == 4 && this.status == 200) {
        myFunction(this);
    }
};
xhttp.open("GET", "books.xml", true);
xhttp.send();

function myFunction(xml) {
    var xmlDoc = xml.responseXML;
    var x = xmlDoc.getElementsByTagName('title')[0];
    var y = x.childNodes[0];
    document.getElementById("demo").innerHTML = y.nodeValue;
}
</script>

</body>
</html>

循环遍历所有 <title> 元素

获取属性值

在 DOM 中,属性也是节点。与元素节点不同,属性节点具有文本值。获取属性值的方式是获取其文本值。

获取属性值 - getAttribute()

getAttribute() 方法返回属性的值。以下代码检索第一个 <title> 元素的 "lang" 属性的文本值:

x = xmlDoc.getElementsByTagName("title")[0];
txt = x.getAttribute("lang");

结果在 txt 中:"en"

循环遍历所有 <book> 元素并获取它们的 "category"

获取属性值 - getAttributeNode()

getAttributeNode() 方法返回属性节点。以下代码检索第一个 <title> 元素的 "lang" 属性的文本值:

x = xmlDoc.getElementsByTagName("title")[0];
y = x.getAttributeNode("lang");
txt = y.nodeValue;

XML DOM 更改节点值

nodeValue 属性用于更改节点的值。

setAttribute() 方法用于更改属性值。

更改元素的值

在 DOM 中,一切都是节点。元素节点没有文本值。元素节点的文本值存储在子节点中,这个节点被称为文本节点。要更改元素的文本值,必须更改元素的文本节点的值。

更改文本节点的值

nodeValue 属性可用于更改文本节点的值。此代码更改第一个 <title> 元素的文本节点值:

xmlDoc.getElementsByTagName("title")[0].childNodes[0].nodeValue = "new content";

示例解释:

  • 假设 books.xml 已加载到 xmlDoc
  • 获取 <title> 元素的第一个子节点。
  • 将节点值更改为 "new content"。

循环遍历并更改所有 <title> 元素的文本节点

更改属性的值

在 DOM 中,属性也是节点。与元素节点不同,属性节点具有文本值。更改属性值的方式是更改其文本值。

使用 setAttribute() 更改属性

setAttribute() 方法更改属性的值。如果属性不存在,则会创建一个新属性。

此代码更改 <book> 元素的 category 属性:

xmlDoc.getElementsByTagName("book")[0].setAttribute("category", "food");

示例解释:

  • 假设 books.xml 已加载到 xmlDoc
  • 获取第一个 <book> 元素。
  • 将 "category" 属性值更改为 "food"。

循环遍历所有 <title> 元素并添加

使用 nodeValue 更改属性

nodeValue 属性是属性节点的值。更改 value 属性会更改属性的值。

xmlDoc.getElementsByTagName("book")[0].getAttributeNode("category").nodeValue = "food";

示例解释:

  • 假设 books.xml 已加载到 xmlDoc
  • 获取第一个 <book> 元素的 "category" 属性。
  • 将属性节点的值更改为 "food"。

XML DOM 删除节点

删除元素节点

removeChild() 方法删除指定的节点。当删除节点时,它的所有子节点也会被删除。

此代码将从加载的 xml 中删除第一个 <book> 元素:

y = xmlDoc.getElementsByTagName("book")[0];
xmlDoc.documentElement.removeChild(y);

示例解释:

  • 假设 books.xml 已加载到 xmlDoc
  • 将变量 y 设置为要删除的元素节点。
  • 使用 removeChild() 方法从父节点中删除元素节点。

删除自己 - 删除当前节点

removeChild() 方法是删除指定节点的唯一方法。当您导航到要删除的节点时,可以使用 parentNode 属性和 removeChild() 方法来删除该节点:

x = xmlDoc.getElementsByTagName("book")[0];
x.parentNode.removeChild(x);

示例解释

  • 假设 books.xml 已加载到 xmlDoc
  • 将变量 y 设置为要删除的元素节点。
  • 使用 parentNode 属性和 removeChild() 方法删除元素节点。

删除文本节点

removeChild() 方法也可以用于删除文本节点:

x = xmlDoc.getElementsByTagName("title")[0];
y = x.childNodes[0];
x.removeChild(y);

示例解释

  • 假设 books.xml 已加载到 xmlDoc
  • 将变量 x 设置为第一个 title 元素节点。
  • 将变量 y 设置为要删除的文本节点。
  • 使用 removeChild() 方法从父节点中删除元素节点。

使用 removeChild() 仅仅为了删除节点的文本不是很常见。可以使用 nodeValue 属性代替。请参阅下一段。

清除文本节点

nodeValue 属性可用于更改文本节点的值:

xmlDoc.getElementsByTagName("title")[0].childNodes[0].nodeValue = "";

示例解释

  • 假设 books.xml 已加载到 xmlDoc
  • 获取第一个 title 元素的第一个子节点。
  • 使用 nodeValue 属性清除文本节点的文本。

通过名称删除属性节点

removeAttribute() 方法按名称删除属性节点。

示例: removeAttribute('category')

此代码将删除第一个 <book> 元素中的 "category" 属性:

x = xmlDoc.getElementsByTagName("book");
x[0].removeAttribute("category");

示例解释

  • 假设 books.xml 已加载到 xmlDoc
  • 使用 getElementsByTagName() 获取 book 节点。
  • 从第一个 book 元素节点中删除 "category" 属性。

循环遍历并删除所有 <book> 元素的 "category"

通过对象删除属性节点

removeAttributeNode() 方法使用节点对象作为参数删除属性节点。

示例: removeAttributeNode(x)

此代码将删除所有 <book> 元素的所有属性:

x = xmlDoc.getElementsByTagName("book");

for (i = 0; i < x.length; i++) {
    while (x[i].attributes.length > 0) {
        attnode = x[i].attributes[0];
        old_att = x[i].removeAttributeNode(attnode);
    }
}

示例解释

  • 假设 books.xml 已加载到 xmlDoc
  • 使用 getElementsByTagName() 获取所有 book 节点。
  • 对于每个 book 元素,检查是否有任何属性。
  • book 元素中存在属性时,删除属性

XML DOM 添加节点

添加节点 - appendChild()

appendChild() 方法将子节点添加到现有节点。新节点在任何现有子节点之后被添加(追加)。注意:如果节点的位置很重要,请使用 insertBefore()

此代码片段创建一个元素(<edition>),并将其添加在第一个 <book> 元素的最后一个子节点之后:

newEle = xmlDoc.createElement("edition");
xmlDoc.getElementsByTagName("book")[0].appendChild(newEle);

示例解释:

  • 假设 books.xml 已加载到 xmlDoc
  • 创建一个新节点 <edition>
  • 将节点追加到第一个 <book> 元素。

此代码片段与上述相同,但新元素添加了一个值:

newEle = xmlDoc.createElement("edition");
newText = xmlDoc.createTextNode("first");
newEle.appendChild(newText);

xmlDoc.getElementsByTagName("book")[0].appendChild(newEle);

示例解释

  • 假设 books.xml 已加载到 xmlDoc
  • 创建一个新节点 <edition>
  • 创建一个新文本节点 "first"。
  • 将文本节点追加到 <edition> 节点。
  • <edition> 节点追加到 <book> 元素。

插入节点 - insertBefore()

insertBefore() 方法在指定的子节点之前插入一个节点。当添加的节点的位置很重要时,此方法很有用:

newNode = xmlDoc.createElement("book");

x = xmlDoc.documentElement;
y = xmlDoc.getElementsByTagName("book")[3];

x.insertBefore(newNode, y);

示例解释:

  • 假设 books.xml 已加载到 xmlDoc
  • 创建一个新元素节点 <book>
  • 在最后一个 <book> 元素节点之前插入新节点。
  • 如果 insertBefore() 的第二个参数为 null,新节点将在最后一个现有子节点之后添加。x.insertBefore(newNode, null)x.appendChild(newNode) 都将向 x 添加一个新的子节点。

添加新属性

setAttribute() 方法设置属性的值:

xmlDoc.getElementsByTagName('book')[0].setAttribute("edition", "first");

示例解释

  • 假设 books.xml 已加载到 xmlDoc
  • 为第一个 <book> 元素的 "edition" 属性设置值为 "first"。

注意: 没有名为 addAttribute() 的方法。如果属性不存在,setAttribute() 将创建一个新属性。如果属性已存在,setAttribute() 方法将覆盖现有值。

向文本节点添加文本 - insertData()

insertData() 方法将数据插入现有文本节点。insertData() 方法有两个参数:offset - 开始插入字符的位置(从零开始),string - 要插入的字符串。

以下代码片段将 "Easy" 添加到已加载 XML 的第一个 <title> 元素的文本节点中:

xmlDoc.getElementsByTagName("title")[0].childNodes[0].insertData(0, "Easy ");

XML DOM 克隆节点

克隆节点

cloneNode() 方法创建指定节点的副本。cloneNode() 方法有一个参数(true 或 false)。此参数指示克隆的节点是否应包括原始节点的所有属性和子节点。

以下代码片段复制第一个 <book> 节点并将其附加到文档的根节点:

oldNode = xmlDoc.getElementsByTagName('book')[0];
newNode = oldNode.cloneNode(true);
xmlDoc.documentElement.appendChild(newNode);

结果

Everyday Italian
Harry Potter
XQuery Kick Start
Learning XML
Everyday Italian

示例解释

  • 假设 books.xml 已加载到 xmlDoc
  • 获取要复制的节点(oldNode)。
  • 将节点克隆到 "newNode"。
  • 将新节点附加到 XML 文档的根节点。

最后

为了方便其他设备和平台的小伙伴观看往期文章:

微信公众号搜索:Let us Coding,关注后即可获取最新文章推送

看完如果觉得有帮助,欢迎点赞、收藏、关注文章来源地址https://www.toymoban.com/news/detail-844248.html

到了这里,关于DOM 节点遍历:掌握遍历 XML文档结构和内容的技巧的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 编写接口文档示例:从零开始,轻松掌握关键技巧

    接口文档的编写是软件开发中至关重要的一环,本文将详细介绍如何编写接口文档示例,为您揭示从基础知识到高级技巧的全过程。通过实用的指导和比喻,让您轻松掌握编写接口文档示例的艺术。 在现代软件开发中,编写接口文档示例是确保项目顺利推进和团队合作的重要

    2024年02月12日
    浏览(43)
  • vue3+echarts应用——深度遍历html的dom结构并用树图进行可视化

    大家好,我是yma16,本文分享关于 vue3+echarts应用——深度遍历 html 的 dom结构并使用树图进行可视化。 💖vue3系列文章 vue3 + fastapi 实现选择目录所有文件自定义上传到服务器 前端vue2、vue3去掉url路由“ # ”号——nginx配置 csdn新星计划vue3+ts+antd赛道——利用inscode搭建vue3(ts)+an

    2024年01月20日
    浏览(65)
  • 数据结构|二叉树的三种遍历方式,你掌握了几种?

    目录 1、遍历方式 2、前序遍历 3、中序遍历 学习二叉树的结构,最简单的方式就是遍历二叉树。遍历二叉树就是 通过某条线路对二叉树的各个结点进行一次访问 ,访问的方法有三种分为前序遍历、中序遍历、后续遍历,层序遍历它们的遍历顺序如下所示: 前序遍历: 根节点

    2023年04月16日
    浏览(46)
  • 掌握Go语言:Go语言范围,优雅遍历数据结构,简化代码操作实战解析(24)

    在Go语言中,范围(range)用于迭代数组、切片、映射、通道等数据结构的元素。范围的语法形式为 for range ,可以遍历集合中的每个元素,并在每次迭代中返回元素的索引(或键)和对应的值。 Go语言范围使用方法 使用范围语句的一般形式为: 其中, index 是元素的索引(或

    2024年04月17日
    浏览(45)
  • 【导出Word】如何使用Java+Freemarker模板引擎,根据XML模板文件生成Word文档(只含文本内容的模板)

    这篇文章,主要介绍如何使用Java+Freemarker模板引擎,根据XML模板文件生成Word文档。 目录 一、导出Word文档 1.1、基础知识 1.2、制作模板文件 1.3、代码实现 (1)引入依赖 (2)创建Freemarker工具类 (3)测试案例代码 (4)运行效果 Word文件有两种后缀格式,分别是:doc和docx,

    2024年02月13日
    浏览(62)
  • 掌握Go语言:Go语言结构体进阶,探索高级特性与实用技巧(23)

    Go语言中的结构体(Struct)除了基本的定义和使用外,还有一些高级用法,可以让我们更灵活地使用结构体。下面详细解释一些高级用法: 结构体嵌套 结构体可以嵌套在其他结构体中,形成更复杂的数据结构。这种嵌套可以使代码更清晰,更符合逻辑。同时,可以通过嵌套来

    2024年03月27日
    浏览(62)
  • 14-数据结构-二叉树的创建以及前中后遍历,以及结点和叶子节点的计算(C语言)

    概述:         二叉树,这里采用孩子链表存储法,即一个数据域和两个左右孩子指针域。随后递归进行遍历即可。在创建二叉树的时候,先创建各个二叉树结点(这里的结点采用动态分配,因此结点为指针变量),随后,再根据逻辑结构图,手动通过左右指针域,链接到对

    2024年02月11日
    浏览(42)
  • 【数据结构与算法】二叉树的深度,节点数,第k层的节点数,遍历,二叉树叶节点的个数

        目录 一.前言 二.二叉树的节点数 二.二叉树的深度 三.二叉树第k层的节点数 四.二叉树的遍历 1.前序遍历 2.中序遍历 3.后序遍历 总结 4.层序遍历 五.二叉树叶节点的个数 我们需要 先构建个二叉树 ,方便后续对函数的测试; 还有我们在实现二叉树的这些函数时, 尽量少用

    2023年04月08日
    浏览(73)
  • 速学数据结构 | 用队列实现栈你都被难住了?那是你没掌握好技巧

    🎬 鸽芷咕 :个人主页  🔥个人专栏 :《Linux深造日志》《C++干货基地》 ⛺️生活的理想,就是为了理想的生活!    🌈 hello! 各位铁铁们大家好啊,栈和队列我们都学过了那么试试用队列实现栈你会嘛?。    ⛳️ 本篇文章就来给大家来篇如何用队列来实现栈的全部解

    2024年02月05日
    浏览(46)
  • 指令模板:技术文档设计与结构化内容架构 | AIGC实践

    【题外话】 在上一篇文章中,有朋友反馈说,【见睿思齐】的字号设置得太小了,读起来有点儿费劲。 首先,特别感谢这位热心读者,开诚布公地与我分享感受,提出宝贵意见,帮助我做得更好。 因此在这篇文章中,我尝试将字号调大1号。大家看看是否还有其他问题,欢迎

    2024年02月09日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包