Introdução ao XML
Aula-01 - Introdução ao XML (2014-1)
Representação de dados
Os dados podem ser representados com diferentes níveis estruturais, como:
Dados não estruturados Compreendem os dados que são lidos como um fluxo de bytes, como arquivos de texto, arquivos “pdf”, arquivos de imagem, arquivos de áudio e arquivos de vídeo. São classificados como Blob (Binary large object) quando o tipo de arquivo for binário, ou como Clob (Character large object) quando o tipo de arquivo for de texto.
Dados semi-estruturados Compreendem os dados que são lidos através da combinação de informações estruturadas com informações não estruturadas, havendo uma estrutura definida em parte do arquivo e não havendo uma estrutura definida na outra parte do arquivo. Nesse caso, o esquema da estrutura de dados está contido juntamente com os dados. Por exemplo, em um e-mail, a parte estruturada compreende nos indicadores , , , e , bem como a parte não estruturada compreende o corpo da mensagem. A definição da estrutura é feita juntamente com os dados (à posteriori), de forma implícita, onde a estrutura pode ser parcial, extensiva e evolucionária, porém não há uma clareza na distinção entre a estrutura e os dados. Dados estruturados Compreendem os dados que são lidos através de uma estrutura rígida, definida previamente (à priori) à inserção dos dados, sendo geralmente armazenadas em arquivos que compõe um Sistema de
Gerenciamento de Banco de Dados (SGBD). Há uma combinação específica de comandos para manipular os dados dessa estrutura, como a inserção, a seleção, a atualização e a remoção. A disponibilização dos dados e a integração com a
Web é feita através do uso de protocolos de conexão e comunicação, como o
JDBC (Java Data Base Connectivity). Por exemplo, em uma tabela de um banco de dados, criamos a estrutura da mesma com um comando similar a
“create table Aluno(matricula int, nome varchar(50), media float, faltas