Navegando por Autor "Moreira, Édimo Fernando Alves"
Agora exibindo 1 - 2 de 2
- Resultados por Página
- Opções de Ordenação
Item Artificial neural networks and linear discriminant analysis in early selection among sugarcane families(Crop Breeding and Applied Biotechnology, 2017-10) Peternelli, Luiz Alexandre; Moreira, Édimo Fernando Alves; Nascimento, Moysés; Cruz, Cosme DamiãoOne of the major challenges in sugarcane breeding programs is an efficient selection of genotypes in the initial phase. The purpose of this study was to compare modelling by artificial neural networks (ANN) and linear discriminant analysis (LDA) as alternatives for the selection of promising sugarcane families based on the indirect traits number of sugarcane stalks (NS), stalk diameter (SD) and stalk height (SH). The analysis focused on two models, a full one with all predictors, and a reduced one, from which the variable SH was excluded. To compare and assess the applied methods, the apparent error rate (AER) and true positive rate (TPR) were used, derived from the confusion matrix. Modeling with ANN and LDA can be used successfully for selection among sugarcane families. The reduced model may be preferable, for having a low AER, high TPR and being easier to obtain in operational terms.Item Técnicas de aprendizado estatístico aplicadas à seleção entre famílias de cana-de-açúcar(Universidade Federal de Viçosa, 2017-10-03) Moreira, Édimo Fernando Alves; Peternelli, Luiz Alexandre; http://lattes.cnpq.br/0290811195300476Uma das grandes dificuldades dos programas de melhoramento de cana-de-açúcar é a seleção de genótipos nas fases iniciais. O uso de métodos estatísticos que visam a predição com base em informações tomadas a nível de campo pode contribuir para aumentar a probabilidade de identificação de genótipos potencialmente superiores. O objetivo deste trabalho é comparar as técnicas de classificação regressão logística (LR), análise discriminante linear (LDA), análise discriminante quadrática (QDA), K-nearest neighboor (KNN), rede neural artificial (ANN) de única camada intermediária, árvores de decisão com random forests (RF) e máquinas de vetor de suporte (SVM) como alternativas para seleção entre famílias de cana-de-açúcar. Os dados utilizados neste trabalho foram provenientes de 5 experimentos, com 22 famílias cada, no delineamento em blocos casualizados, com 5 repetições. Nestes experimentos foram coletados os caracteres de produção, número de colmos (NC), diâmetro de colmos (DC) e a altura de colmos (AC), bem como a produtividade real, expressa em tonelada de cana por hectare (TCHr). Para o treinamento dos métodos de classificação foram utilizados, como variáveis explicativas, os caracteres indiretos de produção NC, DC e AC. A variável resposta utilizada no treinamento foi a indicadora Y = 0 , se a família não foi selecionada via TCHr, e Y = 1 , caso contrário. Previamente à obtenção das regras de classificação, os valores de NC, DC e AC foram padronizados para média 0 e variância 1. Além disso, visando maior eficiência no treinamento dos modelos, foram produzidos dados sintéticos com base na simulação de valores de NC, DC, AC e TCHr para 1.000 famílias. A simulação foi feita utilizando a estrutura de médias e covariâncias fenotípicas de cada i-ésimo experimento. As análises foram processadas em 5 diferentes cenários de acordo com o experimento utilizado para simulação e treinamento dos dados. Foram ainda considerados dois modelos, um completo, com todos os preditores, NC, DC e AC, e um reduzido, onde foi excluída a variável AC. Para avaliação dos classificadores foram utilizadas a taxa de erro aparente (AER) e a taxa de verdadeiros positivos (TPR). Todas as técnicas apresentam alta concordância com a seleção via TCHr (AER média < 0,14), em ambos os modelos, completo e reduzido. No modelo completo, o melhor desempenho, menor AER média (AER=0,0886) e maior TPR média (TPR=0,9831), foi observado no classificador SVM. No modelo reduzido, os classificadores ANN (AER média=0,0932; TPR média=0,9210), SVM (AER média=0,0977; TPR média=0,9417) e k-nearest neighboor (AER=0,1000, TPR=0,9167) apresentam os melhores resultados. O modelo reduzido pode ser preferido, pois apresenta resultados similares ao completo e tem a vantagem de ser operacionalmente mais simples