XML XSL
O HTML foi especificamente desenhado para descrever apresentação; já o XML foi projetado para descrever conteúdo e difere do HTML em três características: estruturas de dados podem ser agrupadas em profundidade ilimitada, novas marcações podem ser definidas, e um documento XML pode conter uma descrição opcional de sua gramática (DTD).
A linguagem XML compreende um padrão adotado pelo W3 Consortium, que além de representar dados semiestruturados, possibilita a troca de dados na Internet. Uma grande quantidade de dados é atualmente publicada em páginas HTML.
Em sua forma básica, o XML é uma sintaxe simples para a transferência de dados, na concepção de dados semiestruturados apresentada anteriormente. Como tal, é possível e mesmo provável que se torne um padrão para troca de dados na Internet. Para uma organização ou grupo de usuários, o XML permite uma especificação que facilita o intercâmbio de dados e a sua reutilização por múltiplas aplicações.
O usuário de XML pode definir novas marcações para indicar estrutura. Por exemplo, a estrutura <pessoa> .... </pessoa> pode ser utilizada para descrever os dados referentes a uma pessoa. Ao contrário do HTML, o XML não fornece instruções de como o conteúdo deve ser apresentado. Existem várias maneiras de se apresentar o conteúdo de arquivos XML, como CSS-Cascade Stylesheets, XSL-XML Stylesheet Language.
A sintaxe do XML é adequada para descrever dados semiestruturados. A linguagem XML pode ser descrita por grafos com nós e rótulos, possibilitando que algoritmos conhecidos possam ser utilizados para a recuperação ou localização de dados em um grafo de grandes proporções.
O componente básico no XML é o "elemento", que é um "pedaço" de texto intercalado pelos sinais "<" e ">", como, por exemplo, "<pessoa>" e "</pessoa>". Dentro do elemento tem-se texto bruto, outro elemento ou uma mistura dos dois.
Uma expressão <pessoa> é chamada marcação inicial, e </pessoa> é chamada marcação final. Estas marcações, são