genetico
Introdução
O genoma humano possui 3 bilhões de bases pareadas arrumadas nos cromossomos de maneira única para cada indivíduo. Um gene corresponde à seqüência específica de bases de nucleotídeos responsável pela codificação de uma proteína e calcula-se que o genoma humano seja composto por 80.000 a 100.000 genes.
Para ter uma idéia melhor: se a seqüência de DNA da nossa espécie fosse compilada em livros, seriam necessários 200 volumes de 1000 páginas cada para armazenar a informação. Levariam cerca de 9,5 anos para ler em voz alta (sem parar) todas as 3 bilhões de bases do genoma de uma pessoa.
Armazenar toda esta informação é um grande desafio para os Especialistas em Bioinformática. Um milhão de bases de seqüência de DNA equivalem a aproximadamente 1 megabyte de dados. Uma vez que o genoma humano possui 3 bilhões de bases, são necessários 3 gigabytes para armazenar genoma inteiro. Isto inclui apenas os dados relativos à seqüência de nucleotídeos e não inclui outras informações que porventura estejam associadas ao sequenciamento.
Os genes humanos variam grandemente em extensão, mas sabe-se que apenas 10% do genoma possui seqüências de genes codificadores de proteína (exons). Intercalando segmentos de exons encontram-se introns, seqüências genéticas aparentemente sem função codificadora.
Um dos novos objetivos do Projeto Genoma Humano (PGH) é identificar as variações individuais do genoma humano. Ainda que cerca de 99% das seqüências de DNA sejam as idênticas entre os indivíduos, o 1% de variações sequenciais restante possui uma grande influência na maneira como os seres humanos respondem às doenças, agressões ambientais e medicamentos.
Estão sendo desenvolvidos métodos para detectar os diferentes tipos de variação, particularmente o mais comum, denominado Polimorfismos de Nucleotídeos Solitários (PNS), que ocorre em uma a cada 100 a 300 bases. Acredita-se que um mapa dos PNS ajudaria a identificar os