Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
Item Detecção de conglomerados dos alertas de desmatamentos no Estado do Amazonas usando estatística de varredura espaço-temporal(Universidade Federal de Viçosa, 2008-08-29) Balieiro, Antonio Alcirley da Silva; Vieira, Carlos Antonio Oliveira; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728250D0; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Santos, Nerilson Terra; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782537A2; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4751574P3; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6Os modelos espaço-temporais desenvolvidos para análises essencialmente empregadas, em dados epidemiológicos humanos, têm um grande potencial para aplicação em estudos florestais e de desmatamento. Neste sentido, esta dissertação aplica uma metodologia para detecção de conglomerados espaço-temporais de casos, em dados oriundos do monitoramento do desmatamento no estado do Amazonas. Com a utilização de um modelo que a metodologia consiste em incorporar simultaneamente a localização e o ano em que supostamente ocorreu o alerta de desmatamento, divulgado pelo DETER (Sistema de Detecção do Desmatamento em Tempo Real na Amazônia) e, verificar, através da abordagem retrospectiva, a existência de conglomerados, históricos e ativos de geometria cilíndrica, de ocorrência de casos significantes, bem como ordenar e localizá-los. Foi escolhida para este estudo a região sul do estado do Amazonas, compreendendo os municípios de Boca do Acre, Lábrea, Canutama, Humaitá, Manicoré, Novo Aripuanã e Apuí. Esta região tem apresentado mudanças constantes de uso do solo, o que tem gerado grande incidência de alertas de desmatamento nos últimos anos. Portanto, esta região faz jus ao estudo de vigilância no sentido de controlar e coibir essas ações antrópicas na região. Os resultados revelaram que o modelo se mostrou eficiente para detectar conglomerados spaço-temporais de alertas de desmatamento, bem como sua localização, tamanho, ordem e características referentes à sua atividade até o final do período estudado. Dos conglomerados detectados dois foram considerados ativos (permanecem ativos até o final do período estudado). Estes conglomerados ativos estão localizados nos municípios de Canutama e Lábrea.Item Análise de sobrevivência do tomateiro a Phytophthora infestans(Universidade Federal de Viçosa, 2008-09-05) Araujo, Maria Nilsa Martins de; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248466E9; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Cota, Luciano Viana; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4778995H6A requeima causada por Phytophthora infestans caracteriza-se por ser uma doença agressiva e de grande impacto destrutivo, podendo limitar ou até mesmo impedir o cultivo econômico do tomateiro sob condições de alta umidade e baixas temperaturas. Diante dos problemas que a requeima pode provocar às lavouras de tomate, este trabalho teve por objetivos: 1) ajustar modelos para descrever o progresso da doença e formar grupos de acessos de tomateiro com curvas semelhantes; 2) estimar dados referentes ao número de dias até atingir 5% de severidade da doença, por meio de regressão inversa; 3) ajustar curvas de sobrevivência por meio do estimador de Kaplan-Meier para grupos de acessos e compará-las mediante o uso do teste Logrank; 4) ajustar curvas de sobrevivência por meio de modelos probabilísticos e compará-las com a técnica não-paramétrica de Kaplan-Meier. Utilizando dados reais sobre a requeima do tomateiro, foi possível ajustar o modelo exponencial (Y = y0 exp (rX)) para descrever o progresso da doença. As médias das estimativas dos parâmetros foram submetidas à análise de agrupamento pelo método Centróide, o que gerou 10 grupos de acessos, sendo o tempo até a incidência de 5% da doença calculado via regressão inversa. Foram utilizadas técnicas não-paramétricas para estimar a função de sobrevivência por meio do estimador de Kaplan-Meier e para comparar as curvas de sobrevivência pelo teste Logrank. Foi também ajustada a função de sobrevivência, empregando-se os modelos probabilísticos Exponencial, Weibull e Log-normal, os quais foram comparados por meio do Teste da Razão da Verossimilhança (TRV), considerando-se o modelo Gama generalizado por ser caso geral para esses modelos. A metodologia utilizada permitiu ajustar o modelo Exponencial para descrever o progresso da requeima do tomateiro e agrupar os acessos estudados em 10 grupos. O acesso BGH-6 sofreu um progresso de doença menor que os demais, caracterizando-se, assim, sua maior resistência à enfermidade. A regressão inversa possibilitou estimar o tempo até a ocorrência de 5% da severidade da requeima do tomateiro. Pela técnica não-paramétrica de Kaplan-Meier, foi possível estimar as curvas de sobrevivência dos acessos de tomateiro pertencentes aos grupos 1, 2, 4, 6 e 8. Utilizando o teste Logrank, pode-se concluir que a maioria das comparações duas a duas foi significativa (p<0,05), exceto nas comparações dos grupos 2x4, 4x8 e 6x8. O uso dos modelos probabilísticos Exponencial, Weibull e Log-normal possibilitou a estimação das curvas de sobrevivência nos grupos 2, 4, 6 e 8, exceto no grupo 4, em que o modelo Weibull não foi adequado. Comparando os modelos probabilísticos com a técnica não-paramétrica, as curvas dos modelos probabilísticos dos grupos 2 e 4 apresentaram ajustes satisfatórios com relação à curva estimada por Kaplan-Meier.Item Metodologias alternativas aos gráficos de controle na caracterização de processos univariados(Universidade Federal de Viçosa, 2008-11-07) Gonçalves, Thiago da Costa; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4241556H4; Santos, Nerilson Terra; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782537A2; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5As empresas têm investido cada vez mais na qualidade, no sentido de buscar maior sobrevivência no mercado, ganhar mais clientes satisfeitos e aumentar a produtividade e a lucratividade. Para buscá-la com mais êxito com auxilio do controle estatístico, faz-se uso dos gráficos de controle que monitoram o processo e sinalizam se há necessidade de corrigi-lo, de maneira que o produto final possa estar dentro dos padrões exigidos pelos consumidores. Na entanto, metodologias alternativas aos gráficos de controle, também podem ser utilizadas para classificar ou discriminar se o processo está ou não sob controle. Neste trabalho foram aplicadas as seguinte: análise discriminante, regressão logística e redes neurais artificiais. Para aplicar cada um dos métodos propostos utilizaram-se dados simulados, onde as medidas de comparação entre eles foram baseadas nas incidências dos alarmes falsos e verdadeiros sobre a classificação desses valores em dentro ou fora de controle estatístico. Foram simulados valores normais e independentemente distribuído sob controle estatístico. Posteriormente, foram impostas variações para que ao final do conjunto de dados saíssem de controle ou que apresentassem autocorrelações. As redes neurais artificiais e regressão logística se mostraram capazes de substituírem os melhores tipos de gráficos de controle, em sinalizarem pontos fora de controle situados ao meio ou ao final do conjunto de dados, sob diferentes distâncias da média de controle e distribuído de forma independente ou não.Item Análise conjunta de fatores: distribuição amostral da importância relativa por simulação de dados(Universidade Federal de Viçosa, 2008-11-17) Temoteo, Alex da Silva; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4255477U5; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; Minim, Valéria Paula Rodrigues; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761407T6; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5Conjoint analysis ou análise conjunta de fatores (ANCF) é uma análise de regressão que utiliza um modelo com variáveis explicativas indicadoras ou dumnmy, para se estudar a preferência de consumidores por tratamentos que podem ser servidos ou produtos, e que são definidos pela combinação de níveis de diversos atributos ou fatores. Com essa técnica estima-se a Importância Relativa (IR) de cada fator que compõe os tratamentos avaliados. Tais estudos são importantes por permitir decidir, com base nas estimativas das IR de cada fator, quais devem ser observados com maior atenção na definição do tratamento. No presente trabalho foi realizado um estudo por simulação para se investigar a robustez da distribuição amostral do estimador da IR de um fator, à variação na distribuição do erro aleatório do modelo de regressão empregado na ANCF. Foram gerados erros aleatórios com a distribuição normal e também três outras distribuições alternativas obtidas por uma transformação de locação e escala da beta: uma distribuição assimétrica à direita, outra assimétrica à esquerda e uma com forma U. Para cada distribuição, utilizou-se desvio-padrão σ = 2,8 e σ = 0,5, portanto para oito condições foram simulados 100 conjuntos de dados referentes a avaliações (notas de aceitação) de 108 consumidores para cada um dos 36 tratamentos formados pela combinação de 4 fatores (A, B, C e D) num esquema fatorial completo 32 x 22. Definiu-se com base em um modelo de regressão para ANCF, valores de referências para as IR's iguais a 44,25%, 25,66%, 26,55% e 3,54%, respectivamente para os fatores A, B. C e D. Na avaliação dos resultados com base em intervalos de confiança percentil e pela aproximação normal, ambos a 95%, verificou-se intervalos mais estreitos pela aproximação normal. Conforme esperado, verificou-se intervalos de confiança para as IR´s mais amplos quando σ = 2,8. Observou-se que todos os intervalos de confiança incluíram os valores das IR's tomados como referência, exceto para os seguintes casos: (i) intervalo de confiança pela aproximação normal para a simulação de erros com distribuição normal e σ = 2,8, para os fatores A e B; (ii) com intervalo pela aproximação normal e σ = 0,5, (iia) para os fatores A e C com distribuição normal, em forma de U e assimétrica à esquerda; (iib) para o fator B com distribuição em forma de U; e (iic) para o fator D com distribuição normal e em forma de U . Entretanto, neste casos de não inclusão do valor IR de referência nos intervalos, observou-se que o valor estava próximo ao limite do IC, tanto à esquerda quanto à direita. As estimativas de IR obtidas no estudo por simulação também foram avaliadas pelo Erro Médio Relativo (EMR) com relação aos respectivos valores de referência. Exceto para o fator D na simulação com erros normais e σ = 2,8, na qual se obteve EMR = 7,91%, em todas as demais situações simuladas obteve-se EMR < 5%. Adicionalmente, o teste de Kolmogorov-Smirnov indicou normalidade (p > 0,05) das distribuições amostrais em todos os casos. Concluiu-se que o estimador da IR pode ser considerado como robusto à não nor-malidade da distribuição do erro aleatório do modelo de regressão utilizado na ANCF. Adicionalmente, pode-se considerar que a distribuição amostral da IR seja normal e que portanto métodos inferenciais que requerem normalidade podem ser aplicados às estimativas de lR's obtidas na ANCF.Item Abordagem Bayesiana do modelo AR(1) para dados em painel: uma aplicação em dados temporais de microarray(Universidade Federal de Viçosa, 2008-12-05) Morais, Telma Suely da Silva; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248026D5; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Caetano, Sidney Martins; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4706384A9Considerou-se uma análise Bayesiana do modelo auto- regressivo de primeira ordem, AR(1), para dados em painel, de forma a utilizar a função de verossimilhança exata, a análise de comparação de distribuições a priori e a obtenção de distribuições preditivas de dados futuros. A eficiência da metodologia proposta foi avaliada mediante um estudo de simulação, no qual a distribuição Beta Generalizada foi usada para representar 3 diferentes prioris: simétrica, assimétrica e constante. Realizou-se uma aplicação em dados reais de expressão gênica temporal de células HeLa gerados por microarray. Os resultados mostraram alta eficiência na previsão da expressão gênica para um instante futuro.Item Avaliação de métodos para determinação do número ótimo de clusters em estudo de divergência genética entre acessos de pimenta(Universidade Federal de Viçosa, 2009-01-19) Faria, Priscila Neves; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4759955H9; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Finger, Fernando Luiz; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783681Y0Muitas vezes, a interpretação dos resultados em análise de agrupamentos é feita de forma subjetiva, isto é, através da inspeção de dendrogramas. Isto se deve ao fato de haver dificuldade em se encontrar na literatura um critério objetivo de fácil aplicação para identificar o número ideal de grupos formados. Diante deste problema, o presente trabalho teve por objetivos: 1) Avaliar a aplicabilidade de critério objetivo de se obter o ponto de corte (número ótimo de clusters) num dendrograma para a tomada de decisão; 2) trabalhar os conceitos de índices como RMSSTD (root mean square standard deviation) e RS (R-Squared), discutindo a contribuição de cada um destes na obtenção do número ótimo de clusters em acessos de Capsicum chinense; 3) aplicação do método, visando a identificar acessos divergentes de Capsicum chinense para serem utilizados em programas de melhoramento. Os índices RMSSTD e RS são calculados de acordo com as variáveis entre e dentro dos grupos formados, caracterizando uma forma objetiva para determinar o número ótimo. Para se obter o ponto de máxima curvatura da trajetória dos índices RMSSTD e RS em função do aumento do número de grupos (X), utilizou-se o Método da Máxima Curvatura Modificado. Foram analisadas, por meio da análise de agrupamentos, algumas características morfológicas de quarenta e nove acessos da espécie Capsicum chinense Jacq. do Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa. A partir das técnicas propostas agrupou-se os acessos, obtendo um número ótimo de grupos. Os resultados classificam os 49 acessos avaliados em apenas sete grupos de acordo com o gráfico do RMSSTD versus o número de grupos e o gráfico do RS versus o número de grupos.Item Verificação dos efeitos das variâncias e das relações de variáveis ligadas à pecuária de leite no agrupamento dos produtores(Universidade Federal de Viçosa, 2009-02-16) Campana, Ana Carolina Mota; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4717195U4; Santos, Nerilson Terra; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782537A2; Campos, José Maurício de Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4798551U0Com o aumento substancial na quantidade de dados armazenados, surge a necessidade da utilização de métodos que permitam analisar simultaneamente várias variáveis medidas em cada elemento amostral, e ainda com a possibilidade de reduzir a dimensionalidade desse conjunto sem perda significativa de informação. Entre eles, pode-se citar o método dos componentes principais, cuja obtenção pode envolver a matriz de covariâncias (S) ou a de correlações (R) das variáveis de interesse. Como a utilização dessas matrizes pode fornecer diferentes componentes, objetivou-se investigar, por meio da simulação de dados, os efeitos das escalas das características sobre a qualidade e a viabilidade da classificação dos elementos amostrais, buscando assim, indicar estratégias de análise mais adequadas em diferentes casos. Além do estudo de simulação, foi realizado outro com variáveis zootécnicas e econômicas referentes a 255 produtores de leite de três regiões do estado de Minas Gerais, com o objetivo de verificar qual a melhor estrutura de dados em classificar de forma mais apropriada os produtores mais viáveis economicamente. Em ambos os estudos, foi efetuada uma transformação nos valores das variáveis baseada nos respectivos coeficientes de variação, cuja matriz de covariâncias foi denominada de S*. Observou-se que a utilização da matriz S privilegiou as variáveis econômicas de maiores variâncias, enquanto a matriz R considerou as variáveis mais correlacionadas entre si como as mais importantes. A obtenção dos CPs com base na matriz S* minimizou os problemas das escalas inerentes aos usos das matrizes S e R. A primeira, por considerá-la totalmente e, a segunda, por desconsiderá-la. Desta forma, considerou-se a matriz S* como a mais indicada no presente estudo de caso, uma vez que priorizou como mais importantes, as variáveis econômicas mais relacionadas às variáveis zootécnicas.Item Avaliação de descritores texturais geoestatísticos e de Haralick para o reconhecimento de plantas daninhas(Universidade Federal de Viçosa, 2009-02-17) Barbosa, Danilo Pereira; Pinto, Francisco de Assis de Carvalho; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4784515P9; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Santos, Nerilson Terra; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782537A2; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4237661D4; Vieira, Carlos Antonio Oliveira; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728250D0; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6A preocupação em minimizar a quantidade de produtos químicos utilizado em lavouras vem aumentando. O uso de sistemas de visão artificial tem demonstrado um grande potencial para o uso de taxas variadas de insumos, como por exemplo, a aplicação de herbicidas somente em locais onde é detectada a presença de planta daninha. O bom desempenho de um sistema desenvolvido para esta finalidade depende principalmente do uso de descritores que permitam diferenciar padrões de plantas daninhas do padrão da espécie cultivada. Sendo assim, objetivo geral do presente trabalho foi desenvolver e avaliar um descritor para o reconhecimento dos padrões planta de milho e planta daninha. Os objetivos específicos foram: a) identificar qual imagem, excesso de verde ou o índice de vegetação de verde normalizado, tende a proporcionar melhor classificação; b) comparar a classificação obtida por descritores geoestatísticos, com a obtida ao usar os descritores de Haralick. Com esta finalidade, foram adquiridas aos 29 dias após a emergência, período em que normalmente é feita a aplicação de herbicidas, nove imagens de milho (Zea Mays L.) e de três espécies de plantas daninhas avaliadas neste experimento: leiteira (Euphorbia heterophylla L.), capim-milhã (Digitaria horizontalis Willd) timbête (Cenchrus echinatus L.). Seis destas imagens foram utilizadas para a seleção do descritor que promove melhor desempenho na classificação. As três restantes foram utilizadas para a validação do descritor selecionado. Cada uma das seis imagens de treinamento foi recortada em 100 blocos de 68x68 pixels. Para cada um dos blocos foi obtido o valor dos descritores texturais geoestatísticos (variograma, o madograma, variograma cruzado e pseudo variograma cruzado) e os de Haralick (momento angular, média, variância, entropia, correlação, momento do produto, momento inverso da diferença e medidas de correlação). Adicionalmente, descritores geoestatísticos e não-geoestatísticos foram obtidos considerando diferentes ângulos (0, 45, 90 e 135°) de relacionamento entre pixels. Descritores geoestatísticos foram, também, obtidos para diferentes distâncias (1, 2, 3, 4, 5, 6, 7, 8, 9, 10) de pareamento entre pixels. Os descritores variograma e madograma foram calculados partir da imagem excesso de verde e GNDVI. Já os descritores variograma cruzado e pseudo variograma cruzado foram calculados com o uso do Greenness Method nos blocos usando as combinações das bandas RxG, GxB e IVxG. Os descritores de Haralick foram calculados a partir das imagens do excesso de verde e GNDVI. O desempenho dos descritores, assim propostos, foi avaliado usando análise discriminante. Os descritores selecionados foram aqueles que apresentaram maior valor para o índice kappa. Adicionalmente, novos descritores foram obtidos a partir de combinações dos descritores selecionados. Estas combinações, também, tiveram o seu desempenho avaliado usando a análise discriminante com o objetivo de identificar qual combinação proporciona melhor desempenho na classificação. Posteriormente, o poder de generalização da combinação selecionada foi avaliado usando as três imagens de cada espécie reservadas para a etapa de validação. As conclusões obtidas com relação aos objetivos propostos nesta pesquisa foram a) a imagem que tendeu a apresentar os melhores resultados do índice kappa foi a imagem excesso de verde; b) os descritores obtidos a partir da função madograma e os de Haralick foram os que forneceram os melhores resultados; c) o descritor geoestatístico madograma nas 10 distâncias e ângulo 0° apresentou melhores resultados de classificação quando usado sem combinação de outros descritores; d) os descritores geoestatísticos e os de Haralick, quando usados isoladamente não apresentaram resultados tão bons quanto combinados; e) o uso de descritores que consideram a continuidade dos valores de pixel, no reconhecimento de padrões pode ser uma ferramenta fundamental no processo de classificação.Item Análise estatística espacial na avaliação de produtividade no melhoramento genético do feijoeiro(Universidade Federal de Viçosa, 2009-02-18) Feres, Andréia Luiza Gonzaga; Carneiro, José Eustáquio de Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783648T9; Santos, Nerilson Terra; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782537A2; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248084A7; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5A dependência espacial é a propensão pela qual o valor de uma variável observada em certa posição tende a assemelhar-se mais aos valores vizinhos do que ao restante das observações do conjunto amostral. O objetivo deste trabalho foi a avaliação da eficiência de alguns métodos de análise estatística espacial para melhorar a precisão experimental em ensaios de seleção de famílias em programa de melhoramento genético do feijoeiro. Foram utilizados dados para produtividade de oito experimentos montados em látice, conduzidos na estação experimental de Coimbra, pertencente ao Departamento de Fitotecnia da Universidade Federal de Viçosa (UFV). Para cada análise, foram analisados os métodos de análise de vizinhança: método das médias móveis, método de Papadakis, reaplicação das médias móveis, reaplicação do método Papadakis e o método com erros dependentes em comparação com a análise tradicional em látice, que desconsidera a dependência espacial entre parcelas quanto ao ajuste dos modelos e à classificação das famílias avaliadas. Foi verificada a existência da dependência espacial nos experimentos pelo teste de Durbin-Watson, semivariograma empírico e teórico com o ajustamento de um modelo geoestatístico para resíduos, verificando a coerência dos dados e percebendo a ocorrência da dependência espacial em seis dos oito experimentos avaliados (capítulo 1). Dos seis experimentos, cinco apresentaram dependência espacial para análise em blocos e um para análise em látice e em blocos, com alcance variando de 2,6 a 33,3 m. No capítulo 2, foram utilizados o teste de Durbin-Watson para verificar a dependência espacial entre resíduos para as diferentes metodologias, além do critério de informação de Akaike (AIC) e do teste da razão da verossimilhança (LRT) para comparar o ajuste dos modelos. Utilizaram-se o coeficiente de variação e a eficiência relativa para comparar a eficiência das metodologias testadas em relação à análise em látice. Também foram utilizados o coeficiente de correlação de Spearman e a eficiência de seleção para comparar as classificações de famílias do feijoeiro obtidas na análise em látice e pelos métodos de análise espacial. Verificou-se que os métodos de análise espacial ajustaram-se melhor aos dados em relação aos métodos que assumem erros independentes. Quanto à precisão experimental, a eficiência da análise em látice foi maior em relação à análise em blocos quando há maior dependência espacial. Os métodos de análise espacial, médias móveis, Papadakis e o método com erros dependentes apresentaram razoável eficiência, enquanto as metodologias propostas, reaplicações das médias móveis e Papadakis foram altamente eficientes em relação à análise em látice, sendo mais eficiente o método reaplicação de Papadakis cuja vizinhança é composta por uma parcela superior e uma inferior em relação à parcela referência. Os métodos testados apresentaram razoável nível de concordância em relação às famílias selecionadas na análise em látice. As metodologias de reaplicação de médias móveis e reaplicação de Papadakis mostram-se altamente eficientes para melhorar a precisão experimental, além de conseguir garantir a independência entre resíduos, sendo uma excelente alternativa de análise em relação à análise em látice.Item Análise de agrupamento para a avaliação de identidade de modelos não-lineares em análise de sobrevivência(Universidade Federal de Viçosa, 2009-02-19) Tomaz, Flávia Sílvia Corrêa; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248223A9; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Silva, Gilson Fernandes da; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4768528D0; Faria, Mercio Botelho; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4183550E7O objetivo desse trabalho foi comparar modelos não-lineares ajustados aos dados de sobrevivência de formigas submetidas a diferentes tratamentos através de metodologia alternativa. Essa metodologia consistiu no uso da técnica de análise de agrupamento, método de Ward, para a identidade de modelos usados em análise de sobrevivência. Os dados utilizados neste trabalho são referentes a um experimento realizado no laboratório de entomologia da Universidade Federal de Viçosa. Foi também utilizado um conjunto de dados simulado com base na distribuição de Weibull. Inicialmente aplicou-se técnica não paramétrica, estimador Kaplan-Meier, a fim de estimar as curvas de sobrevivência de cada tratamento e, em seguida, o teste logrank para a comparação dessas curvas. Para os dados reais foi ajustado o modelo logístico aos tempos de sobrevivência, enquanto que, para os dados simulados foi ajustado o modelo de Weibull. Para cada caso agrupou-se os parâmetros estimados de cada modelo utilizando-se as técnicas de análise de agrupamento. Os resultados encontrados pelo agrupamento foram equivalentes aos do teste logrank. Concluiu-se que a metodologia proposta mostrou ser eficiente e menos trabalhosa, quando várias curvas de sobrevivência precisam ser comparadas.Item O uso de simulação de Monte Carlo via cadeias de Markov no melhoramento genético(Universidade Federal de Viçosa, 2009-02-20) Nascimento, Moysés; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; http://lattes.cnpq.br/6544887498494945; Ferreira, Adésio; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4777896Y8; Viana, José Marcelo Soriano; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4786170D5Este trabalho teve por objetivo fornecer um referencial teórico e aplicado sobre os principais métodos de simulação de Monte Carlo via cadeias de Markov (MCMC), buscando dar ênfase em aplicações no melhoramento genético. Assim, apresentaram-se os algoritmos de Metropolis-Hastings, simulated annealing e amostrador de Gibbs. Os aspectos teóricos dos métodos foram abordados através de uma discussão detalhada de seus fundamentos com base na teoria de cadeias de Markov. Além da discussão teórica, aplicações concretas foram desenvolvidas. O algoritmo de Metropolis- Hastings foi utilizado para obter estimativas das freqüências de recombinação entre pares de marcadores de uma população F2, de natureza codominante, constituída de 200 indivíduos. O simulated annealing foi aplicado no estabelecimento da melhor ordem de ligação na construção de mapas genéticos de três populações F2 simuladas, com marcadores de natureza codominantes, de tamanhos 50, 100 e 200 indivíduos respectivamente. Para cada população foi estabelecido um genoma com quatro grupos de ligação, com 100 cM de tamanho cada. Os grupos de ligação possuem 51, 21, 11 e 6 marcadores, com uma distância de 2, 5, 10 e 20 cM entre marcas adjacentes respectivamente, ocasionando diferentes graus de saturação. Já o amostrador de Gibbs foi utilizado na obtenção das estimativas dos parâmetros de adaptabilidade e estabilidade, do modelo proposto por Finlay e Wilkinson (1963), através da inferência bayesiana. Foram utilizados os dados de médias de rendimento de cinco genótipos avaliados em nove ambientes, provenientes de ensaios em blocos ao acaso com quatro repetições. Em todas as aplicações os algoritmos se mostraram computacionalmente viáveis e obtiveram resultados satisfatórios.Item Discriminação de populações com diferentes graus de similaridade por redes neurais artificiais(Universidade Federal de Viçosa, 2009-12-15) Pereira, Tiago Martins; Regazzi, Adair José; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783586A7; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; http://lattes.cnpq.br/1234901953219216; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Carneiro, Pedro Crescêncio Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4728227T6A correta classificação de indivíduos em grupos pré-estabelecidos tem se tornado de grande importância no melhoramento genético. As técnicas de estatística multivariada usualmente utilizadas nesse tipo de problema são as funções discriminantes de Fisher e as funções discriminantes de Anderson, que são usadas para alocar um indivíduo inicialmente desconhecido em uma das g populações ou grupos pré-definidos. Nas últimas décadas vêm surgindo um novo paradigma de computação, as redes neurais artificiais, que podem ser utilizadas para resolver diversos problemas da Estatística, como agrupamento de indivíduos similares, previsão de séries temporais e em especial, os problemas de classificação. O objetivo dessa pesquisa foi realizar um estudo comparativo entre as funções discriminantes de Fisher e de Anderson e as redes neurais artificiais quanto ao número de classificações erradas de indivíduos sabidamente pertencentes a diferentes populações, com distintos níveis de dissimilaridade. Essa dissimilaridade, medida pela distância de Mahalanobis, foi um conceito de fundamental importância na utilização das técnicas de discriminação, pois quantificou o quanto as populações eram divergentes. Quanto maior o valor observado para essa medida, menos similares foram as populações em análise. A obtenção dos dados foi feita através de simulação utilizando o programa computacional Genes (CRUZ, 2006). As redes neurais artificiais apresentaram uma taxa de indivíduos rejeitados por serem considerados ambíguos quanto às suas características discriminatórias. No entanto, mostraram-se uma técnica promissora no que diz respeito a problemas de classificação, uma vez que apresentaram um número de classificações erradas de indivíduos menor que aqueles dados pelas funções discriminantes.Item Classificação da qualidade dos experimentos com cana de açúcar(Universidade Federal de Viçosa, 2010-02-04) Couto, Maurício Farias; Barbosa, Marcio Henrique Pereira; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782585E6; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4216691T9; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5O coeficiente de variação como medida de precisão experimental tem sido utilizado para diversas culturas. O presente trabalho teve como objetivo geral avaliar o coeficiente de variação e acurácia seletiva como estatísticas candidatas a precisão experimental em ensaios com cana de açúcar. Objetivos específicos: (i) Propor faixas de classificação do coeficiente de variação em experimentos com cana de açúcar para diversas variáveis utilizadas por pesquisadores da cultura; (ii) estabelecer limites adequados para o coeficiente de variação, com aplicabilidade em experimentos com cana de açúcar, considerando as variáveis mais utilizadas nos ensaios, através do critério de classificação proposto por Costa (2002), levando em consideração as diferenças de produtividade ao longo dos cortes; (iii) Avaliar o coeficiente de variação e a acurácia seletiva como medidas de precisão experimental em experimentos com cana de açúcar. Para esse estudo foram consideradas algumas das variáveis mais utilizadas por pesquisadores desta cultura. Os dados foram obtidos de extensa revisão bibliográfica em revistas científicas, banco de dados do programa de melhoramento de cana de açúcar da Universidade Federal de Viçosa, dissertações de mestrado, teses de doutorado e relatórios técnicos. Foram propostas faixas de classificação segundo o método de Costa (2002), o qual se baseia no uso da mediana e do pseudo-sigma. As variáveis altura e brix apresentaram as menores faixas de classificação de CV, seguidas pelo número de colmos, Pol % da cana e tonelada de brix por hectare. As variáveis tonelada de colmo por hectare, tonelada de pol por hectare e peso da parcela apresentaram as maiores faixas de classificação do coeficiente de variação. Todas as variáveis apresentaram faixas de classificação específica, evidenciando a necessidade de se considerar, na classificação dos CV, a natureza da variável estudada. Para os limites de classificação por cortes os dados utilizados foram obtidos do banco de dados do programa de melhoramento de cana de açúcar da Universidade Federal de Viçosa separados por cortes 1º, 2º e 3º. Foram propostos faixas de classificação dentro de cada corte. Para isso utilizou-se o método proposto por Costa et al. (2002). Houve discordância quanto às faixas de classificação por corte para cada variável, acarretando em faixas de classificação especifica. Este resultado evidencia a necessidade de se considerar, na classificação dos CV, a natureza da variável estudada e os cortes. A variável TPH e TCH apresentaram maiores limites nas faixas de classificação por cortes. Com o objetivo de propor uma avaliação da acurácia seletiva como candidata a precisão experimental em ensaios do programa de melhoramento genético da cana de açúcar da Universidade Federal de Viçosa. Foram realizadas análises de variância para os dados de produtividade de cana de açúcar de 111 ensaios, e coletados os valores das estatísticas: quadrado médio do genótipo, quadrado médio do erro, média geral do ensaio, valor do teste F para genótipo e coeficiente de variação experimental. A seguir, foram estimadas as estatísticas, coeficiente de variação genotípica (CVg), coeficiente de variação experimental (CVe), herdabilidade (h2), acurácia seletiva (AS). Valores de F para as cultivares de cana de açúcar devem ser iguais ou superiores a 5,05 pra se obter uma acurácia tida como ideal (≥ 0,90). Experimentos com valores do F abaixo de 1,17 devem ser descartados, pois não atendem a uma acurácia mínima. Concluiu-se que o coeficiente de variação é uma estatística recomendada para avaliar a precisão experimental em experimentos com cana de açúcar com médias semelhantes ou de mesmo corte, pois para cada corte existe limites de classificação diferenciado. A acurácia seletiva apresentou-se como uma candidata viável para classificar experimentos advindos do programas de melhoramento genético da cana de açúcar por levar em consideração os atributos número de repetições e as variações ambiental e genética como ficou demonstrado neste trabalho.Item Análise de trilha em dados de produção e tecnológicos da cana-de-açúcar(Universidade Federal de Viçosa, 2010-02-04) Espósito, Deiciana Pagano; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; Barbosa, Marcio Henrique Pereira; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782585E6; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; http://lattes.cnpq.br/7018279585926960; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5Com o objetivo de quantificar os efeitos diretos e indiretos, por meio da análise de trilha, utilizando valores fenotípicos e genotípicos dos componentes de produção - número de colmos por parcela, diâmetro médio de colmos e comprimento médio de colmos - sobre produtividade de colmos por hectare em cana-de-açúcar, foram obtidos dados de dois experimentos nas fases de cana-planta e cana-soca, em etapa inicial de seleção do programa de melhoramento da cana-de-açúcar no estado de Minas Gerais. Foram avaliados, ao nível de parcela, os caracteres tonelada de colmos por hectare (TCH), como variável principal, e seus componentes de produção, número de colmos (NC), diâmetro médio de colmos (DC) e comprimento médio de colmos (CC), como variáveis explicativas. Os coeficientes de determinação foram elevados em todas as análises de trilha, indicando que os componentes avaliados explicam grande parte da variação existente na produção de colmos. Pela análise dos efeitos diretos fenotípicos e genotípicos, NC foi a variável que melhor se correlacionou com TCH, em ambos os experimentos e estágios, demonstrando a possibilidade de obtenção de ganhos significativos por meio da seleção indireta para TCH via NC. A avaliação das relações de causa e efeito entre os componentes de produção em cana-de-açúcar possibilitou verificar que houve variação entre os experimentos, o que provavelmente se deve à origem diferenciada das famílias avaliadas. Como na técnica de análise de trilha os parâmetros são estimados a partir de matrizes de correlações que podem ser mal condicionadas por efeito de multicolinearidade entre as variáveis envolvidas, foram avaliados dados em cana-soca, obtidos do programa de melhoramento da cana-de-açúcar da Universidade Federal de Viçosa, para comparar o método baseado na regressão em crista e a exclusão de variáveis por componentes principais para a estimação dos coeficientes de trilha em presença de multicolinearidade. Foram amostradas dez plantas por parcela para realização das análises das variáveis explicativas Brix (teor de sólidos solúveis), Pol (teor de sacarose aparente), pH (indica o grau de acidez), AR (açúcares redutores), ART (açúcares totais recuperáveis), Cu (cobre), Al (alumínio), Mg (magnésio), Ca (cálcio), K (potássio), Ácido aconítico, Compostos fenólicos, e da variável principal Cor ICUMSA. A matriz de correlação obtida dos dados foi submetida a diferentes métodos para diagnóstico de multicolinearidade. Sob multicolinearidade severa, os métodos baseados na regressão em crista e em componentes principais apresentaram resultados semelhantes na estimação dos coeficientes de trilha, proporcionando sensível redução na magnitude dos fatores de inflação da variância associados aos efeitos diretos e indiretos da análise de trilha. Assim, foi possível identificar neste estudo, os caracteres alumínio (Al), potássio (K) e Compostos fenólicos como aqueles que melhor explicam a Cor do caldo. Contudo, os demais caracteres devem ser levados em consideração devido a elevada correlação existente e a baixa magnitude do efeito direto, evidenciando a necessidade de seleção simultânea de caracteres, com ênfase também nos caracteres cujos efeitos indiretos são significativos. Para fins de melhoramento, a seleção indireta para Cor do caldo, por meio de índice de seleção envolvendo as variáveis Brix, Pol, AR, ATR, pH, Cu, Al, Mg, Ca, K, Compostos fenólicos e Ácido aconítico é recomendável.Item Comparação dos métodos soma constante e análise conjunta de fatores para estimar a importância relativa(Universidade Federal de Viçosa, 2010-02-11) Dias, Adriana; Minim, Valéria Paula Rodrigues; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761407T6; Regazzi, Adair José; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783586A7; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; http://lattes.cnpq.br/9808310940421979; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2A proposta deste trabalho foi comparar os métodos Soma Constante (SC) e Análise Conjunta de Fatores (ANCF) para estimar a importância relativa ((IR%)) dos fatores em estudos da preferência do consumidor. O objetivo principal foi verificar se o método SC pode ser utilizado para avaliar as estimativas de IR (%) obtidas pela ANCF. Foi realizado um estudo para avaliar a intenção de compra de uma bebida láctea sabor café com base na embalagem. Utilizou-se uma amostra de 192 julgadores residentes na cidade de Viçosa. Os fatores e respectivos níveis avaliados foram: tamanho da embalagem (200 mL e 1000 mL), nome do produto (café e chocolate e chocolate e café) e informação descafeinado (com e sem). Com as estimativas de IR (%) fornecidas pelos julgadores obtidas pelos dois métodos foram realizadas análises descritivas: gráficos Box e Whisker, histogramas e tabelas com medidas descritivas; e também análises inferenciais: teste t para dados pareados e para amostras independentes e testes de hipóteses lineares gerais. Optou-se por realizar as análises com e sem a exclusão de julgadores que não se adequaram ao modelo da ANCF, com base na não significância (valor p > 0,20) da Análise de Variância (ANOVA) realizada para os três fatores com os dados fornecidos por cada julgador. Após a realização das análises estatísticas concluiu-se que o método SC não se mostrou apropriado para avaliar os valores de importância relativa dos fatores estimados na ANCF. Devido à facilidade de aplicação, o método SC pode ser utilizado como um pré-estudo na seleção fatores para serem submetidos à ANCF, principalmente quando existem muitos fatores avaliados no estudo.Item Classificação multivariada de modelos de crescimento para grupos genéticos de ovinos de corte(Universidade Federal de Viçosa, 2010-02-11) Silveira, Fernanda Gomes da; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://lattes.cnpq.br/0551611721454653; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Nascimento, Carlos Souza do; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4734058H3O objetivo principal desse trabalho foi utilizar a análise de agrupamento para classificar modelos de crescimento não-lineares tendo em vista os resultados de diferentes avaliadores de qualidade de ajuste ao considerar dados dos seguintes grupos genéticos de ovinos de corte: Dorper x Morada Nova (DMN), Dorper x Rabo Largo (DRL) e Dorper x Santa Inês (DSI). Após a indicação do modelo comum adequado aos três grupos, objetivou-se também aplicar a identidade de modelos com o intuito de identificar o grupo genético com maior eficiência de crescimento. Toda a metodologia foi aplicada a duas situações experimentais distintas: com repetição, considerando todos os animais de cada grupo genético, e sem repetição, considerando dados médios de cada um destes grupos. Ajustaram-se doze modelos não-lineares, cuja qualidade de ajuste foi medida pelo coeficiente de determinação ajustado (R2 aj), critério de informação de Akaike (AIC), critério de informação Bayesiano (BIC), erro quadrático médio de predição (MEP) e coeficiente de determinação de predição (R2 p). Os modelos Richards e von Bertalanffy foram, respectivamente, os que apresentaram os melhores ajustes para os conjuntos de dados médios e individuais. De acordo com testes de identidade de modelos, o grupo genético DSI foi o que apresentou maior peso adulto, sendo este, portanto, o mais recomendado para exploração de carne.Item Comparação de métodos para estimar o tamanho ótimo de parcela em bananeira(Universidade Federal de Viçosa, 2010-02-12) Silva, Willerson Custódio da; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; http://lattes.cnpq.br/7100345720446348; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Puiatti, Mário; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783362Z2O objetivo deste trabalho foi avaliar os métodos da Máxima Curvatura, Máxima Curvatura Modificado e Modelo Linear de Resposta Platô na determinação de tamanho ótimo de parcela, uma vez que os métodos tradicionais da Máxima Curvatura e Máxima Curvatura Modificado superestimam e subestimam, respectivamente, o tamanho da unidade básica. Por essa razão, foi proposta neste trabalho a comparação entre esses métodos e o método do Modelo Linear de Resposta Platô, considerando-se dados de genótipos de bananeira. Avaliaram-se os caracteres vegetativos altura da planta, perímetro do pseudocaule, número de folhas vivas no florescimento, número de filhos emitidos até o florescimento e número de folhas vivas na colheita. Nessa avaliação, cada planta foi julgada como uma unidade básica (ub) com área de 6 m2, perfazendo, assim, 360 unidades, cujas adjacentes foram combinadas de modo a formar 23 tamanhos de parcelas preestabelecidas, com formatos retangulares dispostos em fileiras. Os resultados indicaram que os tamanhos de parcela variaram com o método utilizado e a variável avaliada. No método da Máxima Curvatura, o tamanho da unidade básica variou entre 17,5 para Número de Filhos Emitidos no Florescimento (NFF) e 20,5 para Número de Folhas Vivas após a Colheita (NFVC), enquanto o coeficiente de variação variou entre 3,2 para Altura da Planta (AP) e 5,3 para Número de Folhas Vivas após a Colheita (NFVC). No método da Máxima Curvatura Modificado, o tamanho da unidade básica variou entre 0,74 para Altura da Planta (AP) e 6,88 para Número de Filhos Emitidos no Florescimento (NFF), enquanto o coeficiente de variação variou entre 5,2 para Altura da Planta (AP) e 13,84 para Número de Filhos Emitidos no Florescimento (NFF). Pelo método do Modelo Linear de Resposta Platô, o tamanho da unidade básica variou entre 10,50 para Número de Folhas Vivas (NFV) e 13,22 para Número de Filhos Emitidos no Florescimento (NFF), enquanto o coeficiente de determinação variou de 71,77% para Número de Filhos Emitidos no Florescimento (NFF) a 80,33% para Número de Folhas Vivas (NFV). Dessa forma, recomenda-se a utilização simultânea de mais de um método para determinação do tamanho ótimo da parcela, a fim de que o tamanho realmente adotado atenda, na medida do possível, aos diversos fatores considerados em cada método.Item Efeitos dos pontos axiais e centrais sobre a eficiência do delineamento composto central(Universidade Federal de Viçosa, 2010-02-24) Perázio, Bráulia Aparecida de Almeida; Santos, Nerilson Terra; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4782537A2; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; http://lattes.cnpq.br/7556927554031300; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Lopes, Jaques Silveira; http://lattes.cnpq.br/1605698945852448Na análise de problemas nos quais a variável resposta de interesse é influenciada por diversos fatores e cujo objetivo é otimizá-la, propõe-se utilizar delineamentos para superfície de resposta. Dentre eles, destaca-se o Delineamento Composto Central (DCC), que é um delineamento de segunda ordem, podendo apresentar características de rotacionalidade e/ou ortogonalidade. Tais delineamentos são simples, econômicos, promissores e bastante flexíveis. Estes são constituídos de pontos fatoriais, axiais e central. Deste modo, o objetivo deste trabalho foi de investigar, por meio da simulação de dados, os efeitos dos pontos axiais e do número de pontos centrais sobre a qualidade dos ajustes das superfícies de reposta obtidas, por meio desse delineamento para dois fatores estudados, quando a região ótima está ou não bem centralizada nos intervalos estudados, buscando assim, indicar estratégias de análises mais adequadas em diferentes casos. Para tanto, utilizou-se como testemunha, o fatorial completo. Para o estudo de dois fatores, foi estabelecido um fatorial completo 9x9 com nove repetições por tratamento, segundo o delineamento inteiramente casualizado, estabeleceu-se também duas superfícies de respostas, uma com ponto crítico próximo ao ponto central e a outra com ponto crítico afastado do ponto central. Definiu-se os valores dos pontos axiais (α) iguais a 1; 1,4142; 2 e 3 e do número de repetições no ponto central iguais a 1, 3, 6 e 9. As observações dos 16 DCCs, foram obtidas a partir da primeira repetição dos respectivos tratamentos (pontos fatoriais, axiais e central) contidos no fatorial completo. Para as diferentes simulações, foi especificado os coeficientes de variação iguais a 5, 10, 20 e 30%. Realizou-se cinco simulações por coeficiente de variação e por superfície de resposta, totalizando 640 arquivos de dados. Para avaliação do grau de aproximação da superfície de resposta ajustada, em relação à verdadeira, utilizou-se como medida a diferença absoluta entre os valores dos coeficientes verdadeiros e estimados (Δβi) e a diferença absoluta relacionada aos pontos críticos (ac e bc) das superfícies de respostas (Δac e Δbc) em relação aos fatores A e B, e para medir o grau de ajuste de cada superfície de resposta utilizou-se o erro percentual médio absoluto (EPMA) e o coeficiente de correlação linear entre os valores ajustados e verdadeiros de Y ( rŷyv ). Contudo, diferentes valores de α proporcionaram melhores estimativas das medidas avaliadas e, como α = 1,4142 está mais próxima de todas elas, concluiu-se que esse valor está, provavelmente entre os melhores para o planejamento dos tratamentos. O valor de α = 1,4142, que possui a propriedade de rotacionalidade, e o aumento do número de repetições no ponto central proporcionou melhor ajuste da superfície de resposta, porém, o aumento da variância residual prejudicou tais estimativas. Portanto, conclui-se que o DCC rotacional deve ser recomendado para experimentos sob condições mais controladas, e quando comparado com o fatorial completo apresentou-se menos eficiente. Além disso, o DCC apresentou resultados similares para as duas superfícies de respostas simuladas.Item Testes estatísticos em regressão logística sob a condição de separabilidade(Universidade Federal de Viçosa, 2010-02-25) Souza, André Oliveira; Colosimo, Enrico Antônio; http://lattes.cnpq.br/8074052644801438; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://lattes.cnpq.br/5802669165872867; Loschi, Rosângela Helena; http://lattes.cnpq.br/8443300958745785; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6A regressão logística é o método estatístico usual de análise utilizado quando o objetivo é verificar a relação entre uma variável resposta dicotômica e variáveis explicativas de interesse. Usualmente, os parâmetros deste modelo são estimados pelo método de máxima verossimilhança genuína, e testes sobre estes parâmetros são construídos considerando as distribuições aproximadas dos estimadores. Isto significa que amostras grandes tornam-se necessárias para obter resultados mais confiáveis. Em estudos envolvendo dados binários, é frequente a presença de uma variável resposta cujo sucesso é pouco provável, ou seja, tem-se um evento raro, o que pode gerar uma amostra de dados esparsos. Nestes casos, diz-se que os dados podem estar sob a condição de separabilidade, e esta situação está frequentemente associada à presença de uma covariável categórica, podendo os estimadores de máxima verossimilhança, para pelo menos um parâmetro, não existir. Na situação de separabilidade recomenda-se utilizar o método de máxima verossimilhança penalizada proposto por Firth (1993). O objetivo principal deste trabalho foi verificar por meio de simulação Monte Carlo os poderes dos testes da razão de verossimilhanças (TRV) e de Wald obtido via máxima verossimilhança penalizada na condição de separabilidade. A metodologia apresentada neste trabalho foi aplicada a dois conjuntos de dados reais. A simulação Monte Carlo com uma variável explicativa no modelo possibilitou obter indicativos que o TRV tem maior poder que o teste de Wald.Item Análise conjunta de fatores baseadas em escolhas: estimação e inferências(Universidade Federal de Viçosa, 2010-04-23) Bastos, Fernando de Souza; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; http://lattes.cnpq.br/9772451905214345; Gava, Rodrigo; http://lattes.cnpq.br/1863489842661064; Caetano, Sidney Martins; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4706384A9Qualquer empresa orientada para o mercado consumidor tem por objetivo oferecer um produto ou serviço, melhor do que seus concorrentes, para que o consumidor venha a preferí-lo e até mesmo pagar um preço maior por ele. Portanto é de interesse conhecer métodos de análise estatística que possam auxiliar nas pesquisas que visem estudar a preferência do consumidor. Uma das metodologias de maior difusão para a análise do mercado consumidor utilizada atualmente é a conjoint analysis traduzida como Análise Conjunta de Fatores (ANCF), conforme proposto por Minim et al. (2006). Apesar da literatura sobre a utilização desta metodologia em pesquisas de mercado ser extensa, ainda existem muitas oportunidades para o estudo de sua utilização, principalmente, relacionadas à análise per si, tais como a inclusão de interações entre fatores no modelo e testes de significância para as importâncias relativas dos fatores. Quando utilizada para avaliar muitos atributos ou atributos com muitos níveis, a ANCF na sua forma tradicional não é indicada. Uma alternativa é apresentar todos os tratamentos ao consumidor e este escolhe o(s) de sua preferência ao invés de atribuir notas ou rank a todos, o que na prática é mais representativo do ambiente real de compra. Essa metodologia é denominada, Choice Based Conjoint Analysis, traduzida como Análise Conjunta de Fatores Baseada em Escolhas (ANCFE). Na presente dissertação descreve-se o modelo da ANCF e suas pressuposições, além de mostrar como é feito a estimação dos parâmetros do modelo, apresenta-se algumas das principais vantagens e desvantagens do modelo e um exemplo de aplicação. Descreve-se também detalhadamente o desenvolvimento do modelo da ANCFE, a estimação dos parâmetros por máxima verossimilhança, com exemplos de aplicação, além de apresentar um estudo por simulação de dados para ilustrar uma comparação entre as metodologias ANCF e ANCFE. Neste estudo foram simuladas notas de aceitação ou intenção de compra atribuídas por 200 consumidores para 8 alternativas de um produto hipotético. Na análise dos resultados da simulação é possível notar que em termos de interpretação as duas metodologias se complementam, dificultando a escolha de uma delas. Porém, a metodologia ANCFE tem a vantagem de ser mais próximo do ambiente real de compra.