Procura de similaridade
Introdu��o
As duas �ltimas d�cadas foram caracterizadas por um grande aumento da quantidade de informa��es geradas pelos projetos genomas. Estas informa��es est�o armazenadas em bancos de seq��ncias de nucleot�deos e de prote�nas, chamados bancos de dados biol�gicos, que devido � melhoria nas t�cnicas de seq�enciamento, t�m tido um crescimento exponencial. Para tentar manipular e analisar este grande volume de informa��o, surgiu um nova �rea do conhecimento denominada bioinform�tica ou biologia computacional. Esta �rea envolve especialistas das �reas de computa��o, matem�tica e biologia e tem como objetivo comum desenvolver t�cnicas eficientes e capazes de responder quest�es pr�ticas do ponto de vista biol�gico. Um exemplo desta intera��o � o tema desta disserta��o que surgiu da possibilidade do desenvolvimento de uma ferramenta no Departamento de Computa��o da UFF para atender a uma necessidade do Laborat�rio de Bioinform�tica do LNCC/MCT nas an�lises de genomas bacterianos.
Estas quest�es biol�gicas tornaram-se ainda mais importantes quando, em 1995, Craig Venter e colaboradores publicaram o primeiro genoma completo da bact�ria H. influenzae [FAO+95] e Blattner et al., em 1997, decifraram o genoma da Escherichia coli K12 [BPB+97]. Desde ent�o, o n�mero de genomas bacterianos decifrados tem aumentado significativamente e, em abril de 2003, existiam 128 genomas dispon�veis para consulta nos bancos de dados p�blicos (www.ncbi.nih.nlm.gov). Se at� ent�o um dos objetivos desta �rea era manipular grandes volumes de dados, comparar seq��ncias de nucleot�deos ou de prote�nas, identificar padr�es com o intuito de obter uma funcionalidade, abre-se a possibilidade de n�o mais comparar pequenos fragmentos mas de comparar organismos completos. A reboque da gen�mica comparativa surgiram algoritmos capazes de fazer o alinhamento e visualiza��o de todo o genoma e assim a detec��o da presen�a/aus�ncia ou transloca��o de regi�es gen�micas puderam ser