minuta
GOVERNO DO ESTADO DE SÃO PAULO
Índice
Índice de Figuras
Índice de Tabela
Capítulo 1 - Introdução
A evolução da ciência da computação nas últimas décadas permitiu a exploração de novos tipos de experimentos científicos baseados em simulação assistida por computadores (Deelman et al. 2009). Com o aumento do desempenho dos computadores, foi possível aumentar também a complexidade dos modelos utilizados nos experimentos científicos. Ao longo do processo de experimentação, os cientistas necessitam desempenhar diversas atividades, e algumas delas estão relacionadas ao encadeamento de programas usados durante as simulações. Cada execução de programa pode produzir uma coleção de dados com determinada sintaxe e semântica. Esta coleção de dados pode ser usada como entrada para o próximo programa a ser executado no fluxo (Taylor et al. 2007a).
O encadeamento destes programas não é uma tarefa trivial e, em muitos casos, pode se tornar uma barreira técnica para a construção de modelos mais sofisticados ou a realização de análise de resultados (Gil et al. 2007a). Este encadeamento é comumente representado por meio de workflows científicos. O termo workflow científico é usualmente utilizado para descrever workflows (Hollingsworth 1995) em qualquer área da ciência, como, por exemplo, biologia, física, química, ecologia, geologia, astronomia e engenharias em geral (Cavalcanti et al. 2005). Estas áreas compartilham algumas características, como a necessidade de manipulação de grandes volumes de dados e demanda de alto poder computacional (Deelman et al. 2009).
Os Sistemas de Gerência de Workflows Científicos (SGWfC) são softwares que proveem a infraestrutura para configuração, execução e monitoramento de recursos de workflows científicos. Muitos SGWfC foram desenvolvidos (Deelman et al. 2009), como, por exemplo, VisTrails (Callahan et al. 2006), Kepler (Altintas et al. 2004), Taverna (Hull et al.