Técnico
Biologia Molecular
M. C. P. de Souto, A. C. Lorena, A. C. B. Delbem, A. C. P. L. F. de Carvalho
1
Laborat´ rio de Inteligˆ ncia Computacional (LABIC) o e
Instituto de Ciˆ ncias Matem´ ticas e de Computacao e a
¸˜
Universidade de S˜ o Paulo-S˜ o Carlos a a
Av. do Trabalhador S˜ o-Carlense, 400 a Cx. Postal 668 - CEP 13566-590
S˜ o Carlos - S˜ o Paulo - Brasil a a
{marcilio,aclorena,acbd,andre}@icmc.usp.br
Abstract. In the last years, the amount of biological data stored in databases has been growing exponentially. As a consequence, the current conventional techniques used to analyze data have been shown limited. Furthermore, the rich information contained in this kind of data and its broad biological implication require new techniques for data analysis. Among the strategies employed for such analysis, one can mention Machine Learning, which can learn automatically from the available data, yielding useful hypothesis. The aim of this tutorial is to introduce Machine Learning techniques in the context of their applications to Molecular Biology problems (gene prediction, analysis of gene expression data and phylogeny construction).
Resumo. Nos ultimos anos, o ac´ mulo de dados biol´ gicos vem aumentando u o
´
exponencialmente. Com isso, meios convencionais para a an´ lise de dados a mostram-se restritos. Al´ m disso, a rica informacao contida nesses dados e ¸˜ e sua vasta implicacao biol´ gica requerem novas t´ cnicas para sua an´ lise.
¸˜
o e a
Dentre as estrat´ gias utilizadas para tal, pode-se destacar o Aprendizado de e M´ quina, que provˆ t´ cnicas capazes de aprender automaticamente a partir a e e dos dados dispon´veis e produzir hip´ teses uteis. O objetivo deste tutorial e ı o
´
´ introduzir t´ cnicas de Aprendizado de M´ quina aplicadas a trˆ s problemas de e a e Biologia Molecular: predicao de genes, an´ lise de dados de express˜ o gˆ nica