HTML naar XML: de markup-taal uitbreiden
Een grote meerderheid van de mensen in de computerindustrie weet wat HTML (Hypertext Markup Language) is. Het bestaat al heel lang en is veelvuldig gebruikt in webpagina-ontwerp dat hoewel het al zeldzaam is om webpagina's uitsluitend in HTML te zien, het wordt beschouwd als basiskennis voor het hele proces van het maken van webpagina's..
XML (Extensible Markup Language), aan de andere kant, is een meer recente en veel minder bekende technologie in vergelijking met HTML. XML is in 1996 door een groep van 11 mensen gemaakt als een aanpassing van SGML (Standard Generalized Markup Language) voor gebruik op het World Wide Web. XML is een meer gestructureerde en strikte markup-taal vergeleken met HTML waarmee gebruikers hun eigen definities en gemoduleerde code kunnen maken. Het is gemaakt om gestandaardiseerde specificaties te creëren voor het maken van aangepaste opmaaktalen die nu bekend staan als XML-dialecten. Het is misschien niet meteen duidelijk, maar aangepaste markup-talen zoals HTML, RSS en Atom zijn allemaal gebouwd vanuit XML als een methode om de bruikbaarheid van internet te vergroten.
Omdat XML is aangepast vanuit SGML bevat het veel code en technieken die oorspronkelijk van SGML waren, zoals de striktheid ervan en een zogenaamde goedgevormdheid. Kenmerken die zelfs tot de nazaten van XML reiken. Bepaalde regels moeten altijd worden overwogen bij het maken van code die is gebaseerd op XML. Er is zelfs een goedgevulde verklaring bij elk document om aan te geven welk type document het is en aan welke regels de verwerking moet zijn gebaseerd. Dit is heel anders in vergelijking met de zeer ontspannen codering die in HTML wordt gebruikt.
Wanneer u een HTML-pagina verwerkt, krijgt u een resultaat, ongeacht de invoer. De HTML-processor probeert te begrijpen wat er in het document stond en maakt een uitvoer waarvan hij denkt dat deze de invoergegevens het beste weergeeft. Dit geldt niet voor XML. XML maakt gebruik van een mechanisme voor foutafhandeling dat als 'draconisch' wordt beschouwd. Wanneer de XML-processor iets tegenkomt dat hij niet kan bevatten, wordt er een foutrapport gemaakt en wordt de verwerking van het bestand beëindigd. Dat laat je met een foutmelding en helemaal geen resultaat anders dan in HTML.
Om het in perspectief te plaatsen is HTML een markup-taal die wordt gebruikt om snel en eenvoudig een bepaalde manier van uitvoer weer te geven. Het gaat niet over de juistheid van de invoer en probeert alleen een uitvoer te maken op basis van het invoerbestand. XML daarentegen is een zeer strikte markup-taal die meestal niet wordt gebruikt om inhoud te creëren. Het primaire gebruik ervan is als een hulpmiddel voor het maken van andere opmaaktalen die de benodigde inhoud maken.