Relatório sobre o programa r
1-Recolha de dados:
Com o objectivo do R reconhecer os dados a utilizar neste trabalho, guardámos com o formato (.csv) que utiliza virgula (,) como elemento separador das colunas.
Deste modo, ao aceder aos dados c5.mushrooms fornecidos no moodle, copiámos os dados para um ficheiro Excel. Este ficheiro foi denominado de dados, e guardámo-lo no formato csv.
Tendo criado o ficheiro dados, o passo seguinte foi aceder o ficheiro a partir do R. Com esse intuito, alterámos o directório, realizando as operações descritas nas imagens.
De seguida, para carregar os dados para um data frame em R usámos os seguintes comandos:
> dados <- read.csv ("dados.csv", header =TRUE)
> dados <- data.frame (dados)
> dados
Acrescentámos o argumento header=TRUE, informando, deste modo ao R, que os dados possuem cabeçalho. Assim sendo, a primeira linha do data frame contém os nomes dos atributos/variáveis.
Uma vez carregado o data frame, obtivemos os dados deste trabalho dispostos da seguinte forma: Cada linha representa um elemento da amostra. A cada linha corresponde um determinado conjunto de variáveis/atributos que são indicados nas colunas do data frame.
Neste trabalho, cada linha corresponde a um cogumelo seleccionado para a amostra. Cada coluna representa os atributos desse cogumelo (CLASS; cap_shape; cap_surface; cap_color; bruises; odor; gill_attachment; gill_spacing; gill_size, gill_color; stalk_shape; stalk_root; stalk_surface_above_ring; stalk_surface_below_ring; stalk_color_above_ring; stalk_color_below_ring; veil_type; veil_color; ring_number; ring_type; spore_print_color; population; habitat).
2- Descrição dos dados
Os dados são provenientes de amostras realizadas a 23 espécies de cogumelos da família Agaricus e Lepiota. Cada espécie é identificada como comestíveis, venenosos, e não recomendado (esta foi combinada com a classe do