XML DOM Traverse Node Tree

Traverseren betekent een lus maken door of reizen over de knooppuntenboom.

De knooppuntenboom doorkruisen

Vaak wil je een XML-document herhalen, bijvoorbeeld: wanneer je de waarde van elk element wilt extraheren.

Dit heet "Door de knooppuntenboom gaan"

Het onderstaande voorbeeld loopt door alle onderliggende knooppunten van <boek> en geeft hun namen en waarden weer:

Voorbeeld

<!DOCTYPE html>
<html>
<body>

<p id="demo"></p>

<script>
var x, i ,xmlDoc;
var txt = "";
var text = "<book>" +
"<title>Everyday Italian</title>" +
"<author>Giada De Laurentiis</author>" +
"<year>2005</year>" +
"</book>";

parser = new DOMParser();
xmlDoc = parser.parseFromString(text,"text/xml");

// documentElement always represents the root node
x = xmlDoc.documentElement.childNodes;
for (i = 0; i < x.length ;i++) {
txt += x[i].nodeName + ": " + x[i].childNodes[0].nodeValue + "<br>";
}
document.getElementById("demo").innerHTML = txt;
</script>

</body>
</html>

Uitgang:

title: Everyday Italian
author: Giada De Laurentiis
year: 2005

Voorbeeld uitgelegd:

Laad de XML-tekenreeks in xmlDoc
Haal de onderliggende knooppunten van het root-element op
Voer voor elk onderliggend knooppunt de naam van het knooppunt en de knooppuntwaarde van het tekstknooppunt uit

Browserverschillen in DOM-parsing

Alle moderne browsers ondersteunen de W3C DOM-specificatie.

Er zijn echter enkele verschillen tussen browsers. Een belangrijk verschil is:

De manier waarop ze omgaan met witruimtes en nieuwe regels

DOM - Witruimten en nieuwe lijnen

XML bevat vaak nieuwe regels of witruimtetekens tussen knooppunten. Dit is vaak het geval wanneer het document wordt bewerkt door een eenvoudige editor zoals Kladblok.

Het volgende voorbeeld (bewerkt door Kladblok) bevat CR/LF (nieuwe regel) tussen elke regel en twee spaties voor elk kindknooppunt:

<book>
<title>Everyday Italian</title>
<author>Giada De Laurentiis</author>
<year>2005</year>
<price>30.00</price>
</book>

Internet Explorer 9 en eerder behandelen GEEN lege spaties of nieuwe regels als tekstknooppunten, terwijl andere browsers dat wel doen.

Het volgende voorbeeld geeft het aantal onderliggende knooppunten weer dat het hoofdelement (van books.xml ) heeft. IE9 en eerder zullen 4 onderliggende knooppunten uitvoeren, terwijl IE10 en latere versies en andere browsers 9 onderliggende knooppunten zullen uitvoeren:

Voorbeeld

function myFunction(xml) {
var xmlDoc = xml.responseXML;
    x = xmlDoc.documentElement.childNodes;
    document.getElementById("demo").innerHTML =
    "Number of child nodes: " + x.length;
}

PCDATA - Geparseerde karaktergegevens

XML-parsers ontleden normaal gesproken alle tekst in een XML-document.

Wanneer een XML-element wordt geparseerd, wordt ook de tekst tussen de XML-tags geparseerd:

<message>This text is also parsed</message>

De parser doet dit omdat XML-elementen andere elementen kunnen bevatten, zoals in dit voorbeeld, waar het <name>-element twee andere elementen bevat (eerste en laatste):

<name><first>Bill</first><last>Gates</last></name>

en de parser zal het als volgt opsplitsen in subelementen:

<name>
<first>Bill</first>
<last>Gates</last>
</name>

Parsed Character Data (PCDATA) is een term die wordt gebruikt voor tekstgegevens die door de XML-parser worden geparseerd.

CDATA - (niet-geparseerde) tekengegevens

De term CDATA wordt gebruikt voor tekstgegevens die niet door de XML-parser moeten worden geparseerd.

Tekens zoals "<" en "&" zijn illegaal in XML-elementen.

"<" zal een fout genereren omdat de parser het interpreteert als het begin van een nieuw element.

"&" zal een fout genereren omdat de parser het interpreteert als het begin van een karakterentiteit.

Sommige tekst, zoals JavaScript-code, bevat veel "<"- of "&"-tekens. Om fouten te voorkomen, kan de scriptcode worden gedefinieerd als CDATA.

Alles binnen een CDATA-sectie wordt genegeerd door de parser.

Een CDATA-sectie begint met " <![CDATA[ " en eindigt met " ]]> ":

In het bovenstaande voorbeeld wordt alles in de CDATA-sectie genegeerd door de parser.

Opmerkingen over CDATA-secties:

Een CDATA-sectie mag de tekenreeks "]]> niet bevatten. Geneste CDATA-secties zijn niet toegestaan.

De "]]>" die het einde van de CDATA-sectie markeert, mag geen spaties of regeleinden bevatten.

❮ Vorig Volgende ❯

XML -zelfstudie

XML AJAX

XML-DOM

XPath- zelfstudie

XSLT- zelfstudie

XQuery- zelfstudie

XML -DTD

XSD- schema

XSD- complex

XSD- gegevens

Webservices _

Referenties

XML DOM Traverse Node Tree

De knooppuntenboom doorkruisen

Voorbeeld

Browserverschillen in DOM-parsing

DOM - Witruimten en nieuwe lijnen

Voorbeeld

PCDATA - Geparseerde karaktergegevens

CDATA - (niet-geparseerde) tekengegevens