Similaridade entre definições de esquemas XML
Sumário
Introdução
Equivalência entre XSDs
Medida de Similaridades
Experimentos Realizados
Trabalhos Futuros
Referências
Introdução
XML – eXtensible Markup Language [1]
Recomendação W3C [2]
Representação de dados e troca de informações
Amplamente utilizada por sistemas de informação
XML Schema [3]
Definem modelos para documentos XML
Validar a informação
Introdução
Motivação
Popularização de aplicações baseadas em XML
Otimização obtida explorando-se as similaridades entre documentos No caso, Esquemas XML
Objeto de estudo
Análise das similaridades
Medida para quantização
Introdução
Similaridade sob dois pontos de vista:
Quantitativo – o quanto os documentos são diferentes
Qualitativo – como se relacionam
Análise quantitativa
Característica chave do Schema Mapping [4, 5]
Busca por esquemas que representam a mesma realidade
Introdução
Na prática, são realizadas comparações:
Estrutural – identificação de classes de equivalências
Semântico – semelhanças semânticas entre nomes de elementos e atributos
A solução proposta
Medida baseada na Edit Distance
Número de operações para transformar uma construção em outra
Hamming distance
Levenshtein distance
Equivalências entre XSDs
DEFINIÇÃO: Sejam Sx e Sy dois fragmentos XSD. Seja I(S)={D | D é um fragmento de documento XML válido contra S}. Então Sx e Sy são estruturalmente equivalentes, Sx ~ Sy, se I(Sx)=I(Sy).
Exemplo de equivalência estrutural
Equivalências entre XSDs
Classes de equivalência
Classe
Contrução
Forma Canônica
CST
Tipo simples definido localmente, tipo simples definido globalmente Tipo simples definido localmente CCT
Tipo complexo definido localmente, tipo complexo definido globalmente Tipo complexo definido localmente CEl
Elemento referenciado, elemento localmente definido
Elemento definido localmente CAt