Artigo Faculdade Traduzido
Adeilton Brandão *
Laboratório de Epidemiologia Molecular de Doenças Infecciosas, Instituto Oswaldo Cruz-Fiocruz, Av. Brasil 4365, 21045-900 Rio de Janeiro, RJ, Brasil
Sequência análise Tag (EST) de sequências expressas rapidamente adquirida utilização generalizada e aplicação para a descoberta de genes transcritos em uma variedade de organismos (Adams et al., 1991). Em 11 de abril de 2008, 51.391.051 ESTs entradas foram registrados no dbEST NCBI (National Center of Biotechnology Information). A maioria deles (61%) são gerados a partir de modelos de laboratório e organismos economicamente importantes (21 espécies; ver Tabela I para os 10 organismos mais freqüentemente seqüenciados). ESTs provaram ferramentas inestimáveis para acelerar a descoberta de seqüências trans-crita no genoma e geração de marcadores para o mapeamento do genoma. Vários métodos de bioinformática para a análise de ESTs em ambas as pequenas e grandes escalas têm sido desenvolvidas nos últimos 10 anos. Uma revisão completa destes métodos, bem como uma análise abrangente sobre a amplitude de suas aplicações para processamento EST, a análise da sequência qualidade e funcional descoberta foi publicada por Nagaraj et al. (2007). Acompanhando esta análise roteiro é um guia através do mundo da EST ferramentas de bioinformática disponíveis em http://biolinfo.org/EST/. Este guia contém uma extensa lista de software e métodos.
Para efeitos do presente artigo de opinião, eu estou focando na coleção Trypanosoma cruzi EST. Esta análise pode, em termos gerais, ser aplicado a outros tripanossomatídeos. Para ilustrar essa opinião com exemplos, eu tenho procurado o conjunto de dados T. cruzi EST conforme descrito abaixo.
A colecção completa de T. cruzi em ESTs do GenBank dbEST- - NCBI foi baixado e rastreadas para a presença do fragmento de spliced leader na extremidade 5 '. Após a eliminação de redundância, este