Utf-8 vs iso-8859-1
Disciplina: Organização e Arquitetura de Computadores I
PESQUISA SOBRE REPRESENTAÇÃO DE DADOS: FORMATO UTF-8 E ISO 8859-1.
2º Semestre de 2012
1. Introdução
É necessário que tenha uma representação de dados para que a maquina possa passar as informações que estão sendo transmitidas ao usuário através de um software. Para que o mesmo usuário possa entender e interpretar a escrita, áudio, imagem, etc. do que esta sendo transmitido pela maquina.
2. UTF-8
UTF-8 (8-bit Unicode Transformation Format) é um tipo de codificação Unicode de comprimento variável. Pode representar qualquer caractere universal padrão do Unicode, sendo também compatível com os caracteres da tabela ASCII. Por esta razão de compatibilidade, está sendo adoptado como tipo de codificação padrão para e-mail, páginas web, e outros locais onde os caracteres são armazenados e frequentemente utilizados. O formato UTF-8 usa de um a quatro bytes por carácter, dependendo do símbolo Unicode que representa. É necessário apenas um byte para codificar os 128 caracteres da tabela ASCII. São necessários dois bytes para caracteres Latinos com diacríticos. São necessários três bytes para o resto do Plano Multilíngue Básico (que contém praticamente todos os caracteres comuns utilizados). Existem ainda outros caracteres que necessitam de quatro bytes.
3. ISO 8859-1
O formato ISO 8859-1 é uma codificação dos caracteres do alfabeto latino, incluindo letras do alfabeto que possuem acentuação. Sendo capaz de representar grande parte dos idiomas da Europa Ocidental.
4. Conclusões
ISO 8859-1 e UTF-8 são dois dos vários tipos de Charsets que podemos utilizar em nossas maquinas para representar dados e informações na tela do computador. Cada qual com sua característica, mas ambos com compatibilidade