Estatística Aplicada e Biometria

URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 10 de 38
  • Imagem de Miniatura
    Item
    Modelos não lineares mistos na análise de curvas de crescimento de bovinos da raça Tabapuã
    (Universidade Federal de Viçosa, 2014-02-21) Pereira, Nayara Negrão; Emiliano, Paulo César; http://lattes.cnpq.br/8618494924305058; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; http://lattes.cnpq.br/4659985829304226; Carneiro, Joel Camilo Souza; http://lattes.cnpq.br/1544158841325922
    A análise de curvas de crescimento de animais tem sido muito utilizada para aumentar a eficiência da pecuária de corte. Estudos relacionados a curvas de crescimento com modelos não lineares mistos podem ter aplicações estratégicas em programas de melhoramento genético na definição de critérios de seleção para precocidade e ganho de peso, tendo em vista, que para cada indivíduo é estimado um coeficiente aleatório, facilitando a identificação e seleção de animais mais eficientes com base nos coeficientes. Essa metodologia considera a variabilidade entre e dentro de indivíduos. O objetivo deste trabalho foi avaliar a eficiência do ajuste de curvas de crescimento através de modelos não lineares mistos. Foram ajustados os modelos não lineares Michaelis-Menten Modificado, Logístico, von Bertalanffy, Gompertz, Richards e Brody, com e sem a incorporação de efeitos aleatórios para análise de curva de crescimento de bovinos de corte da raça Tabapuã. Para comparação entre modelos fixos e mistos foram utilizados os seguintes avaliadores de qualidade de ajuste: critério de informação de Akaike (AIC), critério de informação bayesiano (BIC), desvio médio absoluto (DMA), erro quadrático médio (EQM) e coeficiente de determinação (R2). A utilização de modelos não lineares mistos foi eficiente para descrever curvas de crescimento de bovinos.
  • Imagem de Miniatura
    Item
    Redes neurais artificiais e análise discriminante linear como alternativas para seleção entre famílias de cana-de-açúcar
    (Universidade Federal de Viçosa, 2014-02-25) Moreira, édimo Fernando Alves; Barbosa, Marcio Henrique Pereira; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782585E6; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; http://lattes.cnpq.br/0290811195300476; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Silva, Felipe Lopes da; http://lattes.cnpq.br/4564712877039359
    Esse desafio advém da grande quantidade de genótipos avaliados e da dificuldade operacional da pesagem das parcelas do experimento, necessária nos principais métodos de seleção. O objetivo deste trabalho é comparar a modelagem por redes neurais, a análise discriminante linear de Fisher e a seleção de famílias usando a variável tonelada de cana por hectare estimada (TCHe) como alternativas para seleção de famílias promissoras em cana-de- açúcar com base nos caracteres indiretos número de colmos (NC), diâmetro de colmos (DC) e altura de colmos (AC). Incialmente foi feita a modelagem via redes neurais em 4 diferentes cenários: com simulação e com padronização das variáveis; com simulação e sem padronização das variáveis ; sem simulação e com padronização das variáveis; e sem simulação e sem padronização das variáveis. Os piores resultados ocorreram no cenário 4, sem padronização e sem simulação e os melhores ocorreram no cenário 1, onde as variáveis foram padronizadas e foram simulados valores de DC, NC, AC e TCHR para 1000 famílias. Posteriormente, foi feita a modelagem via análise discriminante no melhor cenário, ou seja, naquele onde houve simulação e padronização das variáveis de entrada. Para avaliação dos métodos redes neurais, análise discriminante e seleção via TCHe - foi utilizada a taxa de erro aparente (TEA) e a taxa de erro 1 (TE1) obtidas a partir da matriz de confusão. A simulação e a padronização melhoram o desempenho das redes neurais. A modelagem via redes neurais artificiais e a análise discriminante linear de Fisher fornecem melhores resultados quando comparadas a estratégia usualmente utilizada, que é baseada na estimação da variável tonelada de cana por hectare. Comparando os modelos de redes neurais com a análise discriminante, a rede neural fornece melhores resultados.
  • Imagem de Miniatura
    Item
    Modelo de fragilidade gama e regressão quantílica em análise de sobrevivência de abelhas melíferas expostas à proteína Cry1Ac
    (Universidade Federal de Viçosa, 2014-02-28) Samudio, Fanni Petrona Ruiz; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Siqueira, Maria Augusta Lima; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777253E4; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/0695547304072125; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/2348397234521519; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2
    As abelhas são seres indispensáveis para a manutenção da biodiversidade e além disso, são responsáveis por grande porcentagem da produção mundial de alimentos. A Apis mellifera é considerada espécie de grande valor econômico, devido a seus produtos para o consumo humano. Atualmente, com a criação de transgênicos resistentes a insetos, aumentou a possibilidade das abelhas entrarem em contato com as proteínas Cry derivada da bactéria Bacillus thuringiensis, que pode ser toxica às abelhas, tornando o estudo dos riscos de toxicidade importante. Portanto, o estudo dessas proteínas nas abelhas pode ser realizada por meio das técnicas da análise de sobrevivência. Nestas técnicas a variável resposta é o tempo até a ocorrência do evento de interesse, denominado tempo de falha, e se a falha não ocorrer, o tempo é denominado censura, que é uma informação parcial. O principal interesse é estimar parâmetros para descrever a sobrevivência ou riscos, num certo tempo determinado. Usualmente quando existem covariáveis que possam influir no tempo de sobrevivência o ajuste pode ser realizado pelo Modelo Regressão de Cox, também conhecido como de modelo de riscos proporcionais, pela suposição dos riscos proporcionais entre os indivíduos ao longo do tempo. No Capítulo I deste trabalho é realizada uma adaptação da Regressão de Cox conhecida como Modelo de Fragilidade, que além de explicar o risco do indivíduo falhar por influência de covariáveis, também descreve a existência de alguma variável aleatória não observada que agrupa indivíduos em conglomerados naturais ou artificiais. Os tempos de sobrevivência foram modelados para explicar o risco de falhar das operárias imaturas de A. mellifera sob o efeito de covariáveis, sendo a colônia utilizada como variável aleatória e a ingestão da proteína Cry1Ac como variável explicativa fixa. Para avaliar a toxicidade de Cry1Ac sobre A. mellifera, foram testadas três diferentes dietas: artificial pura (D0), artificial diluída em água com Cry1Ac (D2) e artificial diluída em água (D2). Os indivíduos foram coletados de cinco colônias diferentes mantidas em Viçosa, Minas Gerais, Brasil. A variável aleatória colônia (fragilidade) foi significativa, indicando diferenças estatísticas nos tempos de vida das abelhas provenientes de diferentes colônias. Dentro dessa diversidade de fragilidade, a dieta artificial diluída em água apresentou risco maior de falhar, significativamente diferente do efeito da dieta controle (artificial pura). Portanto, a sobrevivência das larvas de abelhas foi diminuída em virtude da adição de água na dieta, pela diluição do alimento. No entanto, a dieta baseada na proteína Cry1Ac não mostrou risco de falha significativo quando comparado com o controle. Uma técnica alternativa ao Modelo de Cox é apresentada no Capítulo II deste trabalho. Quando se verifica que os riscos dos indivíduos, ao longo do tempo dentro da amostra, não são proporcionais, é necessário estratificar ou realizar um outro procedimento na análise. Uma alternativa que pode ser utilizada é a Regressão Quantílica, que estuda a relação entre a variável dependente e as variáveis explicativas nos quantis condicionais, por meio da minimização de erros absolutos ponderados. Esta técnica possui propriedades de equivariância, invariância para transformações monotômicas e robustez na presença de outlier. Assim, pela equivariância podem ser aplicados aos dados com censura. Foi verificado que no mesmo conjunto de dados de biossegurança da proteína Cry1Ac em abelhas denominadas A. mellifera que os riscos de falhar dos indivíduos não são proporcionalidades para as diferentes dietas estudadas. Os tempos de sobrevivência das abelhas foram ajustados pela regressão quantílica, utilizando o estimador de Portnoy para 14 quantis. Nos quantis {0,10; 0,15; 0,30; 0,40} os coeficientes são valores negativos significativamente diferentes de zero. Por tanto, nestes quantis os indivíduos alimentados com a dieta pura (D0) tiveram maior tempo de sobrevivência, que aqueles que têm incorporado à proteína Cry1Ac na dieta (D1), isto aconteceu entre os indivíduos mais novos, já que nesses quantis os tempos de vida das larvas são inferiores ao tempo de vida mediano. Os coeficientes para os quantis {0,35; 0,50;0,60} apresentaram efeito negativo estatisticamente significativos, por tanto a incorporação da água na dieta influiu na sobrevivência das larvas aproximadamente nos tempos medianos de vida.
  • Imagem de Miniatura
    Item
    Regressão quantílica na avaliação da adaptabilidade e estabilidade fenotípica
    (Universidade Federal de Viçosa, 2014-02-17) Barroso, Laís Mayara Azevedo; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/2348397234521519; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; http://lattes.cnpq.br/8587813175766141; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2
    No melhoramento genético de plantas, quando o objetivo é selecionar ou recomendar genótipos para o plantio, o estudo da interação entre genótipo x ambiente é de extrema importância. Entretanto, tal estudo não fornece informações pormenorizadas sobre o comportamento de cada cultivar diante das variações ambientais. Assim, tornam-se necessárias as análises de adaptabilidade e de estabilidade para a identificação e recomendação de materiais superiores em diferentes ambientes. Embora a literatura apresente diversos métodos, para realização da análise de adaptabilidade e estabilidade, nenhum leva em consideração a presença de fenótipos não normais, ou seja, distribuições de valores fenótipos assimétricos ou com caudas pesadas. Desta forma, caso haja a presença desse tipo de valores fenotípicos, os métodos podem sofrer a influência de modo que a recomendação pode ser errônea, ou seja, o uso de tais métodos ocasionam estimativas inadequadas, que não refletem a verdadeira relação existente entre a variação ambiental e a resposta fenotípica. Uma solução interessante para tratar este problema de maneira unificada, isto é, a presença de pontos discrepantes ou assimetria, é a utilização de regressão quantílica (RQ). Tal metodologia, diferentemente dos métodos de regressão usuais, que utilizam a média condicional para explicar a relação funcional entre a variação ambiental e a resposta fenotípica, faz uso de funções quantílicas condicionais. Desta forma, a RQ possibilita escolher o quantil que melhor representa a relação funcional de interesse com o intuito de contemplar naturalmente a mencionada falta de normalidade. Desta forma, o presente trabalho tem como objetivo apresentar a metodologia de regressão quantílica, através de uma discussão detalhada de seus fundamentos teóricos, evidenciando, com aplicações concretas, seu uso em análise de adaptabilidade e estabilidade, fornecendo assim um material de fácil acesso para leitores interessados no assunto, contribuindo com pesquisadores e interessados nesta área. Para avaliação da técnica foram simulados valores fenotípicos, com distribuições simétrica, simétrica com outliers, assimétrica à direita, assimétrica à direita com outliers, assimétrica à esquerda e assimétrica à esquerda com outliers. Além disso, foram utilizados dados provenientes de um experimento sobre produção de matéria seca de 92 genótipos de alfafa (Medicago sativa) avaliados em 20 ambientes. Sugere-se que, para valores fenotípicos simétricos deve-se averiguar se este possui outlier, se sim é utilizada ou a regressão não paramétrica ou a RQ (τ = 0,50) , se não, se utiliza ou a metodologia de Eberhart e Russell (1966) ou a RQ (τ = 0,50) . Já se o fenótipo for assimétrico, com ou sem a presença de outlier, utiliza-se RQ (τ = 0,25) para assimetria a direita e RQ (τ = 0,75) para assimetria à esquerda. De acordo com os resultados encontrados a RQ foi eficiente para classificação de genótipos de alfafa.
  • Imagem de Miniatura
    Item
    Técnica de agrupamento na seleção de modelos de regressão não lineares para descrição do acúmulo de matéria seca em plantas de alho
    (Universidade Federal de Viçosa, 2014-02-19) Puiatti, Guilherme Alves; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/3292690471132609; Ferreira, Adésio; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y8
    Estudos de divergência genética entre indivíduos ou populações de plantas e sua trajetória de crescimento são de grande importância em programas de melhoramento, sendo essenciais para a obtenção de informações relevantes para um manejo adequado das plantas. Das técnicas empregadas para tal, a análise de agrupamento e modelos de regressão são amplamente utilizados. Assim, o objetivo deste estudo foi identificar e agrupar modelos de regressão não linear que melhor se ajustam na descrição do acúmulo de matéria seca total da planta do alho ao longo do tempo (60, 90, 120 e 150 dias após plantio). Foram utilizados 15 acessos de alho pertencentes ao Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH/UFV). Os modelos de regressão não linear ajustados para cada um dos acessos foram: Brody, Gompertz, Logístico, Mitscherlich e von Bertalanffy. A qualidade de ajuste dos modelos foi determinada pelo coeficiente de determinação ( R 2 ); quadrado médio do resíduo ( QMR ); desvio médio absoluto dos resíduos ( DMA ); critério de informação de Akaike ( AIC ); e critério de informação Bayesiano ( BIC ). Então, para cada acesso, os modelos foram submetidos a análise de agrupamento, com os avaliadores de qualidade de ajuste considerados como variáveis, utilizando o algoritmo UPGMA, a distância generalizada de Mahalanobis como medida de dissimilaridade, e número de grupos determinado pelo método de Mojena. Depois, os modelos ajustados para cada acesso foram novamente agrupados seguindo o mesmo critério, mas utilizando os parâmetros com interpretação biológica como variáveis, e os resultados dos diferentes agrupamentos foram então confrontados. Comparando os resultados dos agrupamentos, observou-se que os modelos Gompertz, Logístico, e von Bertalanffy apresentaram melhores resultados quanto aos avaliadores de qualidade de ajuste, e tiveram resultados próximos quanto a estes e quanto as estimativas dos parâmetros. Estes três modelos se mostraram eficientes para descrição de matéria seca total da planta em acessos de alho, especialmente o modelo Logístico.
  • Imagem de Miniatura
    Item
    Monitoramento de processo seis sigma por gráficos de controle de Shewhart
    (Universidade Federal de Viçosa, 2013-08-02) Marques, Caio Augusto Nunes; Faria, Adriana Ferreira de; http://lattes.cnpq.br/2061974461207641; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; http://lattes.cnpq.br/0413873956037204; Minette, Luciano José; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785551D5
    Desenvolvida em 1987 na Motorola, a metodologia Seis Sigma busca, mediante redução na variabilidade dos processos-chave, obter características críticas para a qualidade (CTQs) com probabilidades de defeitos próximas de zero. Tem-se um processo Seis Sigma quando a distância entre o valor-alvo (VN) da CTQ e o limite de especificação mais próximo for igual ou superior a seis desvios-padrão (σ). Na prática, por maior que seja a atenção dispensada ao processo, a média da distribuição de probabilidades da CTQ pode deslocar em até 1,5σ do valor-alvo, que ainda assim o processo será considerado Seis Sigma. Então existe um intervalo de 4,5 a 6σ, no qual o processo pode variar sem que perca o nível de qualidade considerado de classe mundial . Desta forma, neste trabalho, buscou-se estabelecer recomendações para o planejamento de gráficos de controle de Shewhart ̅ e R para o monitoramento de processos Seis Sigma. Para tanto, estabeleceu-se um desempenho de referência no qual se admitiu a probabilidade do alarme falso conjunto igual ou inferior a 0,01; e a probabilidade do alarme verdadeiro conjunto crescendo de acordo com a redução do nível Sigma do processo, passando de 0 em processos 6σ para 0,10 naqueles 5σ, atingindo 0,90 em processos 4,5σ até atingir a unidade para processos 3σ e inferiores. Nesse sentido, investigou-se planejamentos com combinações entre n = 2, 3, 4 e 5 e k = 2,5, 2,6, 2,7, 2,8, 2,9 e 3,0. Identificou-se que o par de gráficos em questão apresentou bom desempenho quando o processo esteve sob efeito somente do deslocamento da média e perdeu desempenho à medida que ocorreu o aumento da variação como única perturbação ou quando as duas anomalias estiveram atuando. Foi possível identificar que o deslocamento da média é o problema mais observado, a ocorrência simultânea das duas anomalias é menos frequente e a presença exclusiva do aumento da variação é rara. Logo, recomendou-se o planejamento com n = 5 e k = 2,9, para o monitoramento de processos Seis Sigma Práticos (isto é, com nível sigma entre 4,5 e 6σ), que apresentou bom desempenho apenas quando o processo esteve principalmente sob efeito do deslocamento da média. Portanto, é provável que o nível de qualidade dos processos caia sem que os gráficos de controle em questão sinalizem a perda da qualidade em função do aumento da variação, com ou sem a presença do deslocamento da média.
  • Imagem de Miniatura
    Item
    Modelagem hierárquica Bayesiana na avaliação de curvas de crescimento de suínos genotipados para o gene halotano
    (Universidade Federal de Viçosa, 2013-07-31) Macedo, Leandro Roberto de; Cirillo, Marcelo ângelo; http://lattes.cnpq.br/9705001233749286; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://lattes.cnpq.br/1661203785619531; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Paixão, Débora Martins; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4779007P3
    Para avaliar a influência do gene halotano sobre a curva de crescimento de suínos, bem como sua interação com o sexo do animal, foi proposta uma modelagem hierárquica Bayesiana. Nesta abordagem, os parâmetros dos modelos não-lineares de crescimento (Logístico, Gompertz e von Bertalanffy) foram estimados conjuntamente com os efeitos de sexo e genótipos do gene halotano. Foram utilizados 344 animais F2(Comercial x Piau) pesados ao nascer, aos 21, 42, 63, 77, 105 e 150 dias. O modelo Logístico foi aquele que apresentou melhor qualidade de ajuste por apresentar menor DIC (Deviance Information Criterion) que os demais. As amostras das distribuições marginais a posteriori para as diferenças entre as estimativas dos parâmetros do modelo Logístico indicaram que o peso dos machos à idade adulta com genótipo heterozigoto (HALNn) foi superior ao dos homozigotos (HALNN). A título de comparação, também foi considerada a abordagem frequentista tradicional baseada em dois passos distintos, a qual, por apresentar um menor poder de discernimento estatístico, não mostrou diferenças significativas.
  • Imagem de Miniatura
    Item
    Uso da Krigagem Indicativa na seleção de áreas propícias ao cultivo de café em consorciação ou rotação com outras culturas
    (Universidade Federal de Viçosa, 2013-02-28) Almeida, Maria de Fátima Ferreira; Santos, Nerilson Terra; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782537A2; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/0674757734832405; http://lattes.cnpq.br/1104831018413450; Oliveira, Fernando Luiz Pereira de; http://lattes.cnpq.br/1284343084296509; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945
    A Geoestatística se destaca, principalmente por ser uma ciência interdisciplinar que permite uma troca de informações entre geólogos, engenheiros de petróleo, matemáticos, estatísticos e demais categorias profissionais possibilitando assim uma melhor interpretação da realidade geológica e ambiental. Dentre as técnicas de Krigagem destaca-se a Krigagem Ordinária e a Krigagem Indicativa. Em que a primeira é um preditor de Krigagem linear pontual que considera a média desconhecida e incorpora em sua formulação o procedimento de uma média ponderada móvel, porém o que a diferencia é o fato de que os pesos são obtidos levando em consideração a continuidade representada pelo semivariograma. A Krigagem Indicativa é um preditor que utiliza-se da técnica de Krigagem Ordinária ou de Krigagem Simples dos dados transformados por meio de uma função não linear binária composta por 0 e 1. Uma das grandes vantagens da Krigagem Indicativa reside no fato de ser um estimador não paramétrico que permite transformar variáveis qualitativas (presença ou ausência) ou variáveis quantitativas (de acordo com um ponto de corte de interesse) e estimar probabilidade de ocorrência da variável. Na agricultura, o seu uso permite fazer planejamento de correção do solo de forma localizada e identificar zonas de manejo para rotação ou consorciação de culturas. Este trabalho tem por objetivo apresentar um estudo teóricoaplicado das vantagens e desvantagens no uso da Krigagem Indicativa para o planejamento de correção do solo para implantação da técnica de consorciação de cultivo de bananeira com o cultivo de café, utilizando dados de propriedades químicas do solo por meio de amostras coletadas em uma fazenda cultivada com café no Município de Araponga- Zona da Mata Mineira.
  • Imagem de Miniatura
    Item
    Transformação de box-cox e escores de blom para correção da heterogeneidade de variâncias do peso de bovinos
    (Universidade Federal de Viçosa, 2013-04-26) Miranda, Gislane Natália de Souza; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/0674757734832405; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; http://lattes.cnpq.br/8242841305562400; Souza, Gustavo Henrique de; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4760298P6
    O objetivo deste trabalho foi verificar a eficiência das transformações de Box- Cox e escores de Blom na correção da heterogeneidade de variâncias fenotípicas dos pesos ajustados de bovinos da raça Tabapuã do Nordeste brasileiro para os fatores regiões de produção, idades e sexos. Foram utilizados dados da raça Tabapuã do Nordeste brasileiro, coletados a partir de 1970, provenientes do controle de desenvolvimento ponderal da Associação Brasileira de Criadores de Zebuíno (ABCZ) com informações relativas a pesos ajustados para 205, 365 e 550 dias de idade. As transformações em escores de Blom e Box-Cox foram utilizadas na tentativa de corrigir a heterogeneidade de variâncias para os fatores regiões de produção, idades e sexos. O teste de Bartlett foi aplicado antes e após a transformação dos dados para verificar se houve redução da heterogeneidade de variâncias fenotípicas. A transformação em escores de Blom foi efetiva na redução dos coeficientes de assimetria e curtose e mostrou-se mais adequada do que a transformação de Box-Cox para correção da heterogeneidade de variâncias fenotípicas entre regiões de produção, idades e sexos, uma vez que apresentou um maior número de resultados favoráveis.
  • Imagem de Miniatura
    Item
    Seleção de famílias de cana-de-açúcar via árvores de decisão
    (Universidade Federal de Viçosa, 2013-03-15) Bernardes, Diego Paiva; Barbosa, Marcio Henrique Pereira; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782585E6; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; http://lattes.cnpq.br/8989832077068553; Kist, Volmir; http://lattes.cnpq.br/6259569656758124
    O processo de seleção de clones de cana-de-açúcar é carente de métodos fitotécnicos e estatísticos que elevem os ganhos genéticos nos programas de melhoramento da cultura da cana-de-açúcar. De cinco fases de seleção do programa de melhoramento da RIDESA, a primeira é dotada de grande importância porque dela se desenvolvem as demais fases do programa e porque o volume de informações a ser analisados é enorme. Assim, caso os dados não forem corretamente analisados, pode-se descartar bons materiais logo nas primeiras fases, diminuindo a excelência do programa. As estratégias usuais de seleção, BLUP e BLUPIS, têm a desvantagem de exigir a de pesagem de toda a parcela. Uma maneira de se contornar isso é categorizar os componentes de produção; altura de colmos, diâmetro de colmos e número de colmos, via árvores de decisão. Através dessas árvores, é possível gerar as combinações desses componentes de produção e os respectivos valores de produção. Utilizando dados de testemunhas para gerar as árvores, não seria necessária a pesagem de toda a parcela, economizando tempo e recursos financeiros. O objetivo desse trabalho foi avaliar a categorização dos componentes de produção como estratégia de seleção entre e dentro de famílias através da comparação de seu desempenho com os métodos usuais, BLUP e BLUPIS. O algoritmo de árvore utilizado foi o CART. De natureza não paramétrica, esse é capaz de produzir divisões binárias combinando as variáveis explicativas e associando-as com distintos valores de resposta. Os dados foram coletados de 5 experimentos, instalados em maio de 2007, no delineamento em blocos casualizados, sendo cada experimento constituído de 5 blocos, 22 famílias e 2 testemunhas. O algoritmo CART foi eficiente em definir as classes dos componentes de produção seguido da seleção das melhores famílias no campo com acurácia média próxima de 73% quando comparado com o BLUPIS e BLUP.