Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
Item Abordagem Bayesiana do modelo AR(1) para dados em painel: uma aplicação em dados temporais de microarray(Universidade Federal de Viçosa, 2008-12-05) Morais, Telma Suely da Silva; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248026D5; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Caetano, Sidney Martins; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4706384A9Considerou-se uma análise Bayesiana do modelo auto- regressivo de primeira ordem, AR(1), para dados em painel, de forma a utilizar a função de verossimilhança exata, a análise de comparação de distribuições a priori e a obtenção de distribuições preditivas de dados futuros. A eficiência da metodologia proposta foi avaliada mediante um estudo de simulação, no qual a distribuição Beta Generalizada foi usada para representar 3 diferentes prioris: simétrica, assimétrica e constante. Realizou-se uma aplicação em dados reais de expressão gênica temporal de células HeLa gerados por microarray. Os resultados mostraram alta eficiência na previsão da expressão gênica para um instante futuro.Item Abordagem estatística de variáveis climáticas de Viçosa - MG(Universidade Federal de Viçosa, 2017-02-15) Lacerda, Maurício Silva; Emiliano, Paulo César; http://lattes.cnpq.br/7403859031624608Conhecer o comportamento de variáveis climáticas como a temperatura e o índice de chu- vas de uma cidade ou região é de grande importância para que haja melhor planejamento e tomadas de decisões futuras, por este motivo estudos destas variáveis estão sempre em evidência. Desta forma, tem-se como objetivo geral realizar um estudo de algumas carac- terísticas do clima da cidade de Viçosa-MG, por meio de séries temporais, com enfoque nas temperaturas máximas e mínimas e no nível de precipitação pluviométrica, com obje- tivo específico de identificar alterações nestes fatores. Para isso analisou-se um conjunto de dados históricos acerca do clima da cidade com registros desde janeiro de 1968 até julho de 2016, iniciando o tratamento dos dados calculando a média mensal para as tem- peraturas e o total mensal para a precipitação, em seguida foi aplicado o teste de Dickey- Fuller aumentado para análise da tendência, e uma decomposição espectral da série nas frequências de Fourier para detectar sazonalidade. Posteriormente, escolheu-se a classe dos modelos SARIMA e as suas ordens escolhidas por meio dos critérios de informação bayesiano (BIC) e Akaike corrigido (AICc). O modelo escolhido foi verificado através de uma análise residual com os testes de Shapiro-Wilk e Ljung-Box. Para a série histórica da média mensal da temperatura máxima o modelo SARIM A(2, 1, 2) × (0, 1, 1) se apresen- tou com bom ajuste. As séries da média mensal da temperatura mínima e da precipitação pluviométrica total mensal necessitaram de um modelo que ajustassem os resíduos para que os pressupostos da modelagem fossem satisfeitos, com isso a primeira teve sua corre- lação serial modelada pelo SARIM A(1, 1, 2) × (0, 1, 1) e seus resíduos pelo ARCH(2) e a segunda série teve os modelos SARIM A(1, 0, 0) × (0, 1, 1) para a ajustar a correla- ção serial e ARCH(2) para os resíduos. Com o presente estudo conclui-se que a cidade de Viçosa-MG teve uma elevação acima de 1°C na média mensal de suas temperaturas máximas e mínimas, enquanto que o nível de precipitação não sofreu alterações ao longo do tempo estudado.Item Abordagem matemática na análise de dados de área aplicada à variável malária em Moçambique(Universidade Federal de Viçosa, 2015-10-07) Chipenete, Cláudio Francisco; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/2557621925960438Ao se analisar os dados de área, um dos principais interesses é entender sua estrutura ou distribuição no espaço e, se existe alguma dependência ou estrutura bem definida entre as diversas áreas na região em estudo. Para mensurar essa dependência fez-se uma análise de padrões utilizando a autocorrelação espacial. O principal objetivo do trabalho foi abordar no enfoque matemático, as técnicas e procedimentos estatísticos na análise espacial de dados de área utilizando o método tradicional para o cálculo do índice de Moran e o método de três passos. Buscou-se também verificar e analisar a existência de algum padrão espacial definido em Moçambique associado a variável malária. A malária tem sido uma das principais causas de internamento nos hospitais e centros de saúde nos últimos anos, igualmente, das mortes da população. Analisar sua distribuição e relacionamento entre diferentes distritos do país poderá contribuir para minimizar os efeitos dessa doença. Os dados foram obtidos do Inquérito Demográfico e de Saúde de Moçambique (IDS) realizado em 2011. Na análise estatística foi possível identificar regiões cujos distritos se assemelhavam por possuírem taxas médias baixas de malária, formando agrupamentos, a saber, nas regiões sul, extremo sul, e norte de Moçambique. Para os demais distritos, verificou-se uma distribuição aleatória de casos da malária. No entanto, foi possível identificar distritos representados pelas cidades de Maputo, Matola e Beira com maior taxa de malária em relação aos demais.Item Abordagens frequentista e bayesiana para descrição das curvas de acúmulo de matéria seca de plantas de alho(Universidade Federal de Viçosa, 2015-12-03) Macedo, Leandro Roberto de; Cecon, Paulo Roberto; http://lattes.cnpq.br/1661203785619531Este trabalho teve como objetivo identificar modelos de regressão não linear que melhor descrevem as curvas de acúmulo de matéria seca em acessos de alho ao longo do tempo (60, 90, 120 e 150 dias após o plantio) utilizando as abordagens Frequentista e Bayesiana. Objetivou-se também agrupar os acessos similares em cada abordagem com relação às estimativas dos parâmetros e validar este agrupamento via inferência para a igualdade desses parâmetros entre os grupos formados. Para tal estudo foram utilizados 30 acessos de alho registrados no Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH/UFV). Os modelos Logístico, Gompertz e Von Bertalanffy mostraram-se bons representantes para este tipo de estudo, sendo o modelo Logístico o que melhor se ajustou aos dados. Após a escolha do melhor modelo em cada uma das abordagens, as estimativas dos parâmetros das curvas provenientes do ajuste deste modelo foram submetidas a análise de agrupamento, em que as estimativas foram consideradas como variáveis. Para o agrupamento foi utilizando o algoritmo de Ward e a distância generalizada de Mahalanobis como medida de proximidade. O número ótimo de grupos, segundo o método de Mojena, foi de três para a abordagem Frequentista e quatro para a Bayesiana. A inferência sobre igualdade de parâmetros das curvas entre os grupos formados indicou que o método Bayesiano mostrou-se eficiente e caracterizou-se como uma ferramenta útil para o estudo das curvas de acúmulo de matéria seca em plantas de alho visto que não apresentou problemas de convergência e reportou estimativas com baixos desvios padrão a posteriori, além de determinar de forma mais efetiva o número de grupos.Item Análise biométrica de acessos de Capsicum chinense Jacq. com ênfase na diversidade genética(Universidade Federal de Viçosa, 2016-02-23) Oliveira, Ana Carolina Ribeiro de; Cecon, Paulo Roberto; http://lattes.cnpq.br/0231423029429573Os estudos de divergência genética são fundamentais para subsidiar ações de conservação, de utilização dos recursos genéticos e posterior aplicação em programas de melhoramento, visando à obtenção de genótipos superiores. Sendo assim, este trabalho teve por objetivo avaliar a diversidade genética de acessos de pimenta, Capsicum chinense Jacq., por meio de técnicas multivariadas de agrupamentos utilizando os métodos hierárquicos (UPGMA e Ward) e de otimização (Tocher e Tocher modificado). O experimento foi conduzido na área experimental do setor de olericultura do Departamento de Fitotecnia da Universidade Federal de Viçosa (UFV), sob delineamento inteiramente casualizado, com quatro repetições e uma planta por parcela. Foram avaliados 11 acessos de C. chinense registrados no Banco de Germoplasma de Hortaliças (BGH/UFV), com base em 11 caracteres. Os resultados indicaram pelos métodos hierárquicos a formação de dois grupos, sendo que 72,73% dos acessos pertenciam ao grupo I e 27,27% ao grupo II; e ambas as estruturas de agrupamento foram validadas pelo coeficiente de correlação cofenética (r). Os métodos de otimização, Tocher e Tocher modificado, reuniram os acessos em seis e quatro grupos, respectivamente, revelando maior diversidade dos acessos em relação aos métodos anteriores. Assim, independente do método utilizado foi possível identificar os acessos mais divergentes e, consequentemente, contribuir para futuras pesquisas de cruzamento buscando híbridos com maior efeito heterótico.Item Análise conjunta de fatores baseadas em escolhas: estimação e inferências(Universidade Federal de Viçosa, 2010-04-23) Bastos, Fernando de Souza; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; http://lattes.cnpq.br/9772451905214345; Gava, Rodrigo; http://lattes.cnpq.br/1863489842661064; Caetano, Sidney Martins; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4706384A9Qualquer empresa orientada para o mercado consumidor tem por objetivo oferecer um produto ou serviço, melhor do que seus concorrentes, para que o consumidor venha a preferí-lo e até mesmo pagar um preço maior por ele. Portanto é de interesse conhecer métodos de análise estatística que possam auxiliar nas pesquisas que visem estudar a preferência do consumidor. Uma das metodologias de maior difusão para a análise do mercado consumidor utilizada atualmente é a conjoint analysis traduzida como Análise Conjunta de Fatores (ANCF), conforme proposto por Minim et al. (2006). Apesar da literatura sobre a utilização desta metodologia em pesquisas de mercado ser extensa, ainda existem muitas oportunidades para o estudo de sua utilização, principalmente, relacionadas à análise per si, tais como a inclusão de interações entre fatores no modelo e testes de significância para as importâncias relativas dos fatores. Quando utilizada para avaliar muitos atributos ou atributos com muitos níveis, a ANCF na sua forma tradicional não é indicada. Uma alternativa é apresentar todos os tratamentos ao consumidor e este escolhe o(s) de sua preferência ao invés de atribuir notas ou rank a todos, o que na prática é mais representativo do ambiente real de compra. Essa metodologia é denominada, Choice Based Conjoint Analysis, traduzida como Análise Conjunta de Fatores Baseada em Escolhas (ANCFE). Na presente dissertação descreve-se o modelo da ANCF e suas pressuposições, além de mostrar como é feito a estimação dos parâmetros do modelo, apresenta-se algumas das principais vantagens e desvantagens do modelo e um exemplo de aplicação. Descreve-se também detalhadamente o desenvolvimento do modelo da ANCFE, a estimação dos parâmetros por máxima verossimilhança, com exemplos de aplicação, além de apresentar um estudo por simulação de dados para ilustrar uma comparação entre as metodologias ANCF e ANCFE. Neste estudo foram simuladas notas de aceitação ou intenção de compra atribuídas por 200 consumidores para 8 alternativas de um produto hipotético. Na análise dos resultados da simulação é possível notar que em termos de interpretação as duas metodologias se complementam, dificultando a escolha de uma delas. Porém, a metodologia ANCFE tem a vantagem de ser mais próximo do ambiente real de compra.Item Análise conjunta de fatores: distribuição amostral da importância relativa por simulação de dados(Universidade Federal de Viçosa, 2008-11-17) Temoteo, Alex da Silva; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4255477U5; Ribeiro Junior, José Ivo; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282Y6; Minim, Valéria Paula Rodrigues; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4761407T6; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5Conjoint analysis ou análise conjunta de fatores (ANCF) é uma análise de regressão que utiliza um modelo com variáveis explicativas indicadoras ou dumnmy, para se estudar a preferência de consumidores por tratamentos que podem ser servidos ou produtos, e que são definidos pela combinação de níveis de diversos atributos ou fatores. Com essa técnica estima-se a Importância Relativa (IR) de cada fator que compõe os tratamentos avaliados. Tais estudos são importantes por permitir decidir, com base nas estimativas das IR de cada fator, quais devem ser observados com maior atenção na definição do tratamento. No presente trabalho foi realizado um estudo por simulação para se investigar a robustez da distribuição amostral do estimador da IR de um fator, à variação na distribuição do erro aleatório do modelo de regressão empregado na ANCF. Foram gerados erros aleatórios com a distribuição normal e também três outras distribuições alternativas obtidas por uma transformação de locação e escala da beta: uma distribuição assimétrica à direita, outra assimétrica à esquerda e uma com forma U. Para cada distribuição, utilizou-se desvio-padrão σ = 2,8 e σ = 0,5, portanto para oito condições foram simulados 100 conjuntos de dados referentes a avaliações (notas de aceitação) de 108 consumidores para cada um dos 36 tratamentos formados pela combinação de 4 fatores (A, B, C e D) num esquema fatorial completo 32 x 22. Definiu-se com base em um modelo de regressão para ANCF, valores de referências para as IR's iguais a 44,25%, 25,66%, 26,55% e 3,54%, respectivamente para os fatores A, B. C e D. Na avaliação dos resultados com base em intervalos de confiança percentil e pela aproximação normal, ambos a 95%, verificou-se intervalos mais estreitos pela aproximação normal. Conforme esperado, verificou-se intervalos de confiança para as IR´s mais amplos quando σ = 2,8. Observou-se que todos os intervalos de confiança incluíram os valores das IR's tomados como referência, exceto para os seguintes casos: (i) intervalo de confiança pela aproximação normal para a simulação de erros com distribuição normal e σ = 2,8, para os fatores A e B; (ii) com intervalo pela aproximação normal e σ = 0,5, (iia) para os fatores A e C com distribuição normal, em forma de U e assimétrica à esquerda; (iib) para o fator B com distribuição em forma de U; e (iic) para o fator D com distribuição normal e em forma de U . Entretanto, neste casos de não inclusão do valor IR de referência nos intervalos, observou-se que o valor estava próximo ao limite do IC, tanto à esquerda quanto à direita. As estimativas de IR obtidas no estudo por simulação também foram avaliadas pelo Erro Médio Relativo (EMR) com relação aos respectivos valores de referência. Exceto para o fator D na simulação com erros normais e σ = 2,8, na qual se obteve EMR = 7,91%, em todas as demais situações simuladas obteve-se EMR < 5%. Adicionalmente, o teste de Kolmogorov-Smirnov indicou normalidade (p > 0,05) das distribuições amostrais em todos os casos. Concluiu-se que o estimador da IR pode ser considerado como robusto à não nor-malidade da distribuição do erro aleatório do modelo de regressão utilizado na ANCF. Adicionalmente, pode-se considerar que a distribuição amostral da IR seja normal e que portanto métodos inferenciais que requerem normalidade podem ser aplicados às estimativas de lR's obtidas na ANCF.Item Análise da dependência espacial em experimentos com cana-de-açúcar da RIDESA(Universidade Federal de Viçosa, 2024-09-28) Silva, Mariana de Oliveira; Carneiro, Antônio Policarpo Souza; http://lattes.cnpq.br/1023852504013417A cana-de-açúcar é uma das culturas agrícolas mais importantes para a economia brasileira, sendo a principal matéria-prima para a produção de açúcar e etanol. Dada sua relevância, o melhoramento genético da cana-de-açúcar é essencial para aumentar a produtividade e a sustentabilidade do setor sucroenergético. A análise de variância tradicional, que assume a independência dos erros, frequentemente confia ao princípio da casualização a tarefa de neutralizar a correlação entre os erros. No entanto, quando a casualização não é realizada corretamente ou a dependência espacial entre parcelas é ignorada, os resultados podem ser comprometidos, reduzindo a eficácia da análise para a seleção de genótipos realmente superiores. Neste estudo, realizou-se uma análise estatística espacial em dois experimentos conduzidos pela Rede Interuniversitária para o Desenvolvimento do Setor Sucroenergético (RIDESA) com o objetivo de avaliar a dependência espacial dos erros aleatórios e verificar se a análise espacial melhora a precisão experimental. A análise inicial dos resíduos empregou o índice de Moran e semivariogramas para identificar a autocorrelação espacial e modelar a estrutura de dependência espacial. Essa estrutura foi posteriormente incorporada aos modelos por meio da matriz de variância e covariância residual (R), possibilitando a comparação entre modelos com erros independentes, modelos com erros dependentes que consideram o controle local do experimento, e modelos com erros dependentes que desconsideram o controle local do delineamento em blocos casualizados. O modelo que desconsiderou o controle local e incorporou a dependência espacial dos erros mostrou o melhor ajuste em um dos experimentos, evidenciando que, em certas condições, a consideração da estrutura espacial pode ser mais eficaz do que o controle local no delineamento. Palavras-chave: autocorrelação espacial; melhoramento correlacionados; geoestatística; precisão experimental. genético; errosItem Análise da detecção e da influência de outliers na avaliação da acurácia posicional de produtos cartográficos(Universidade Federal de Viçosa, 2021-08-27) Cristo, Sabrina Lourdes Pereira de; Santos, Nerilson Terra; http://lattes.cnpq.br/4426790564356034Outliers são dados que se diferem do conjunto de dados ao qual pertence e podem ser identificados aplicando métodos próprios para esta finalidade. A detecção de candidatos a outliers é objeto de interesse de várias áreas, dentre elas o controle de qualidade cartográfica, que tem por objetivo avaliar a qualidade de um produto cartográfico e assegurar para qual finalidade o produto cartográfico pode ser utilizado. Um dos elementos do controle de qualidade cartográfica é a acurácia posicional, que mede a qualidade da posição geográfica de dados geoespaciais. A análise da qualidade da posicional deve ser avaliada em termos de precisão e tendência. A precisão é feita seguindo as recomendações do Decreto 89.817, ET- ADGV e ET-CQDG, enquanto para a tendência podem ser utilizados testes inferenciais, como o Teste t de Student, e a estatística espacial, usando a média direcional e a variância circular. A presença de outliers pode comprometer tanto a precisão quanto a tendência e apesar da importância da detecção de candidatos a outliers, essa etapa não é bem definida nas normas, que não a tratam como obrigatória. Dessa forma, objetivou-se analisar o impacto da detecção de candidatos a outliers na avaliação da acurácia posicional e avaliar o desempenho de diferentes métodos de detecção de candidatos a outliers. Para isso, foram avaliados cinco produtos cartográficos quanto a sua acurácia posicional de duas formas, a primeira sem realizar a etapa de detecção de candidatos a outliers, fazendo a análise de precisão e tendência, e a segunda maneira acrescentando a detecção de candidatos a outliers, aplicando sete métodos para cada base de dados, sendo eles: Método 3σ, Diagrama Box-Plot, Método Standard Deviation, Método Hampel, Teste de Dixon, Teste de Grubbs e Teste de Chauvenet. Com isso, notou-se que a presença de pontos outliers afeta a qualidade do produto cartográfico e que após sua remoção, a classificação dos dados quanto à acurácia posicional tem uma melhoria. Palavras-chave: Outliers. Controle de Qualidade Cartográfica. Acurácia Posicional.Item Análise de agrupamento para a avaliação de identidade de modelos não-lineares em análise de sobrevivência(Universidade Federal de Viçosa, 2009-02-19) Tomaz, Flávia Sílvia Corrêa; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248223A9; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Silva, Gilson Fernandes da; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4768528D0; Faria, Mercio Botelho; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4183550E7O objetivo desse trabalho foi comparar modelos não-lineares ajustados aos dados de sobrevivência de formigas submetidas a diferentes tratamentos através de metodologia alternativa. Essa metodologia consistiu no uso da técnica de análise de agrupamento, método de Ward, para a identidade de modelos usados em análise de sobrevivência. Os dados utilizados neste trabalho são referentes a um experimento realizado no laboratório de entomologia da Universidade Federal de Viçosa. Foi também utilizado um conjunto de dados simulado com base na distribuição de Weibull. Inicialmente aplicou-se técnica não paramétrica, estimador Kaplan-Meier, a fim de estimar as curvas de sobrevivência de cada tratamento e, em seguida, o teste logrank para a comparação dessas curvas. Para os dados reais foi ajustado o modelo logístico aos tempos de sobrevivência, enquanto que, para os dados simulados foi ajustado o modelo de Weibull. Para cada caso agrupou-se os parâmetros estimados de cada modelo utilizando-se as técnicas de análise de agrupamento. Os resultados encontrados pelo agrupamento foram equivalentes aos do teste logrank. Concluiu-se que a metodologia proposta mostrou ser eficiente e menos trabalhosa, quando várias curvas de sobrevivência precisam ser comparadas.Item Análise de componentes principais e análise de fatores em acessos de Capsicum annuum L. no estudo de variabilidade genética(Universidade Federal de Viçosa, 2023-08-30) Santos, Raquel Cordeiro; Cecon, Paulo Roberto; http://lattes.cnpq.br/8324411827990437As pimenteiras pertencem a família Solanácea e ao gênero Capsicum, a qual representa grande variabilidade de plantas. As pimentas são consumidas em todo o mundo e em razão de seus diversos usos e demanda de mercado é necessário buscar opções de maior qualidade e produtividade, o que pode ser feito pela escolha de genótipos superiores. O objetivo dessa pesquisa foi estudar a variabilidade genética de acessos de pimenta (C. annuum) por meio de técnicas de análise de componentes principais e análise de fatores. Utilizando o delineamento experimental inteiramente casualizado, com quatro repetições foram analisados nove acessos de Capsicum annuum L., são eles: Pimenta Vulcão, Pimenta Cayene, Pimenta Peter, Pimenta Picante para vaso, Pimenta Jamaica Yellow, Pimenta Doce Italiana, Pimentão Quadrado, Pimentão Cascadura Ikeda e Pimentão Rubi Gigante. As características avaliadas foram: peso total do fruto (PT, g), comprimento do fruto (COM, mm), largura do fruto (LAR, mm), espessura do pericarpo (ESP, mm), número de sementes por fruto (NS), massa da matéria total do fruto fresca (MF, g), Massa da matéria total do fruto maduro seco (MS, g), Teor de sólidos solúveis (BRIX), Teor de Vitamina C (VIT, mg100g −1 ). Foi aplicada a técnica de análise multivariada denominada de componentes principais (ACP), que permitiu reduzir a dimensão da amostra, pela qual foram retidos dois componentes que juntos explicaram mais de 90% da variabilidade contida nos dados. A análise de divergência genética entre os acessos foi realizada por meio da técnica de análise multivariada denominada de análise de fatores (AF), seguido da rotação Varimax, levando a identificação de três grupos geneticamente divergentes o que permite abordagens mais direcionadas para otimizar as características-chave relacionadas ao mercado de pimentas. Palavras-chave: Análise multivariada. Variabilidade genética. Pimenta.Item Análise de correspondência: uma abordagem geométrica(Universidade Federal de Viçosa, 2012-06-28) Silva, Yury Vasconcellos da; Regazzi, Adair José; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783586A7; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/0674757734832405; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; http://lattes.cnpq.br/0641718908659343; Lopes, Jaques Silveira; http://lattes.cnpq.br/1605698945852448; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7A análise de correspondência é uma técnica estatística multivariada que permite realizar a análise simultânea de diferentes variáveis categóricas. Possui aspecto simples e intuitivo na apresentação de resultados por meio dos mapas perceptuais. Apesar da análise de correspondência estar disponível em diversos softwares, incluindo o sistema livre R, o principal problema que contribui para o desconhecimento do potencial desta técnica e de sua consequente difusão é a existência de diversos textos especializados de difícil compreensão, por apresentarem um alto nível de algebrismo, abstração e por omitirem passos elucidativos importantes. Por outro lado, a leitura pura e simples das técnicas de interpretação se torna desprovida de sentido convincente, que pode levar a equívocos e insegurança nas interpretações e impede até mesmo de tirar o maior proveito possível dos resultados. Assim, o objetivo deste trabalho foi elaborar um texto elucidativo que mostrasse os detalhes matemáticos de todas as etapas da análise de correspondência, de forma aplicada e com ênfase na construção geométrica. Uma aplicação desta técnica com dados de um experimento na área de melhoramento genético da cana-de-açúcar é apresentada na qual constatou-se que o número de colmos é um fator determinante para antecipar a categoria de peso da touceira. Esta informação é de fundamental importância, uma vez que pode facilitar os aspectos operacionais na seleção de famílias para o melhoramento genético, visto que o pesquisador não necessitará esperar a época da colheita para selecioná-las, pois poderá fazê-la previamente se baseando naquelas com os maiores números de colmos. Portanto concluiu-se que esta técnica pode ser promissora em ciências agrárias. Apesar da leitura do presente trabalho exigir tempo e disposição, o mesmo contribui para um melhor entendimento desta técnica, principalmente para um leitor não muito afeito aos desenvolvimentos algébricos, pois ele fornece uma visão completa do passo a passo da análise de correspondência simples através da visão geométrica e do exemplo ilustrativo.Item Análise de dados de RNA-Seq com diferentes números de fatores e repetições(Universidade Federal de Viçosa, 2015-07-22) Souza, Vladimir Barbosa Carlos de; Peternelli, Luiz Alexandre; http://lattes.cnpq.br/7804746265517309A tecnologia RNA-Seq mostrou-se ser revolucionária para o estudo de expressão gênica. Porém, mais estudos na literatura sobre a análise de dados de RNA-Seq são necessários, até mesmo porque se trata de um método de elevado custo. Devido a este alto custo, é importante o aproveitamento das amostras disponíveis para concluir sobre mais fatores e suas interações. Este trabalho tem como objetivo realizar um comparativo do desempenho da análise de identificação de DEGs (genes diferencialmente expressos) em experimentos com diferentes números de fatores e repetições, mas todos com o mesmo número de amostras, ou seja, com o mesmo custo. Para as análises, foram simulados conjuntos de dados provenientes de experimentos com diferentes números de fatores e repetições. Para a realização dessas simulações foi utilizado o pacote TCC, desenvolvido para o software livre R, para a normalização dos dados também foi utilizado o TCC, e para a identificação dos DEGs foi utilizado o pacote DESeq, também desenvolvido para o R. Por último, o desempenho das análises de cada experimento foi calculado utilizando-se curvas ROC (Receiver Operating Characteristics), usando-se o pacote ROCR, também disponível para o R. Após o cumprimento da metodologia, pôde-se observar que, na ausência de interação entre fatores, não ocorre perda de desempenho das análises ao adicionar mais fatores, e, quando existe interação entre fatores, ocorre essa perda. Portanto, o uso de mais fatores, ao custo de se ter menos repetições, pode ser vantajoso.Item Análise de estilo baseada em retornos: um estudo aplicado aos fundos de previdência complementar oferecidos pelo instituto Agros(Universidade Federal de Viçosa, 2021-11-04) Prates, Carlos Victor Bragatto; Barbosa, Eduardo Campana; http://lattes.cnpq.br/4525845624417719A introdução do Plano Real, em 1994, promoveu uma profunda mudança no cenário econômico nacional, bem como na postura do cidadão brasileiro, no que se refere a gestão do seu patrimônio pessoal e a escolha de estratégias e instrumentos financeiros, que permitam uma administração eficiente do mesmo. Nesse sentido, uma categoria de investimento que vem se destacando é a dos planos de previdência privada, uma importante alternativa para auxiliar o brasileiro no planejamento e no acúmulo de recursos para o futuro. Logo, o objetivo deste trabalho é aplicar a metodologia da Análise de Estilo Baseada em Retornos ou RBSA (do inglês, Return Based Style Analysis), para avaliar as estratégias de investimento ou de alocação de recursos e os retornos de dois planos previdenciários (B e CD) oferecidos pelo Agros, um Instituto da UFV de Seguridade Social, que oferece e administra planos de previdência privada e de saúde, com o intuito de suplementar os benefícios pagos pela previdência social aos servidores e ex-servidores da Universidade Federal de Viçosa (UFV). A referida metodologia utiliza um modelo de regressão linear múltipla, que através da imposição de algumas restrições paramétricas, busca estimar o percentual de alocação de um fundo a determinadas classes de ativos, descritas à priori nos documentos regulatórios do mesmo. Palavras-chave: Economia. Gestão. Investimentos. Restrições paramétricas. Regressão linear múltipla.Item Análise de fatores aplicada a predição genômica considerando seleção de marcadores em Oryza sativa(Universidade Federal de Viçosa, 2021-02-19) Fialho, Izabela Clara; Azevedo, Camila Ferreira; http://lattes.cnpq.br/1414652656084772O arroz asiático Oryza sativa é um dos alimentos mais consumidos em grande parte do mundo. Assim, o crescimento populacional justifica o interesse dos pesquisadores em tornar as variedades deste arroz altamente produtivas. Para alcançar esse objetivo, a Seleção Genômica Ampla (Genome Wide Selection - GWS) é uma ferramenta utilizada pelos programas de melhoramento. A GWS emprega dados fenotípicos e genotípicos por meio de marcadores SNPs (Single Nucleotide Polymorphism) amplamente distribuídos no genoma. Porém, nem todos estes SNPs estão associados as características de relevância para o pesquisador, o que torna necessário o uso de métodos estatísticos para a seleção de marcadores. O BLUP genômico (Genomic best linear unbiased prediction – G-BLUP) é um método amplamente aplicado a predição genômica, e quando este está associado a seleção de marcadores dá origem ao chamado G-BLUP supervisionado. Dessa forma, o presente trabalho objetivou-se avaliar a eficiência na predição genômica ao combinar a análise de fatores e a seleção de marcadores via G-BLUP supervisionado para grupos de características de interesse. O conjunto de dados de arroz utilizado é público e faz parte de dois projetos, o Projeto OryzaSNP e o Projeto OMAP e está disponível no site http://ricediversity.org/data/. O arquivo contém informações de 28 características fenotípicas e 36.901 marcadores SNPs de 413 indivíduos. Os resultados obtidos indicam que a aplicação da análise de fatores combinada à seleção de marcadores SNPs para a predição genômica se mostrou eficiente, visto que apresentaram valores semelhantes para capacidade preditiva em relação aos encontrados considerando as análises individuais das variáveis (em ambas as análises obteve-se variação entre 0,6 a 0,8 de capacidade preditiva) e alta concordância (acima de 50% de concordância para todos os grupos de marcadores) entre os indivíduos selecionados considerando o fator e as variáveis individuais. Palavras-chave: Arroz. Seleção genômica. G-BLUP.Item Análise de fatores aplicada em estudos de seleção genômica no melhoramento de Coffea canephora(Universidade Federal de Viçosa, 2020-02-20) Paixão, Pedro Thiago Medeiros; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/0114089076153492O Brasil se destaca em âmbito mundial na produção de café. Os incrementos observados em sua produtividade é resultado do aprimoramento de diversas metodologias. Dentre elas, destacam-se os métodos preditivos de valor genético. Estes contribuem significativamente na seleção de genótipos superiores, de forma a aumentar o ganho genético por unidade de tempo. Neste contexto, a seleção genômica ampla (GWS) é uma ferramenta que se destaca, uma vez que permite predizer o fenótipo futuro de um indivíduo baseado apenas em informações de marcadores moleculares. Realizar a seleção de maneira simultânea para várias características é o interesse da maioria dos programas de melhoramento, e a análise de fatores (AF) tem sido utilizada para auxiliar neste fim. A utilização de fatores se justifica devido a existência de correlações genéticas entre as características, as quais podem ser atribuídas aos QTL que têm efeitos pleiotrópicos ou aos QTL estreitamente ligados. Dessa forma, o objetivo deste trabalho foi de avaliar o uso da AF no contexto de GWS, em genótipos de Coffea canephora. Os resultados obtidos da seleção baseada nos fatores foram comparados, por meio da capacidade preditiva, acurácia e do coeficiente de Cohen’s Kappa, com aqueles advindos da análise das variáveis individuais. Para isso, foram utilizados dados fenotípicos e genotípicos de populações compostas por clones dos grupos varietais Conilon e Robusta e por híbridos originados de cruzamentos entre estes grupos, avaliados durante três anos consecutivos (2014 a 2016), e uma densidade de 18111 marcadores SNPs identificados. A partir dos resultados observados, verificou-se que a AF foi eficiente para elucidar as relações entre as características e originar novas variáveis. Os fatores formados são interessantes em termos de seleção, pois além de permitirem interpretações conjuntas, apresentam boas estimativas de capacidade preditiva, herdabilidade e acurácia. Ademais observou-se alta concordância entre os indivíduos selecionados com base nos fatores e aqueles selecionados considerando as variáveis individuais. Entretanto, cabe destacar que, a seleção baseada nos fatores conseguiu selecionar indivíduos de porte mais adequado. Palavras-chave: Predição Genômica. Análise Multivariada. Melhoramento Genético.Item Análise de fatores aplicada na seleção genômica em suínos(Universidade Federal de Viçosa, 2015-02-26) Teixeira, Filipe Ribeiro Formiga; Nascimento, Moysés; http://lattes.cnpq.br/4574646837472160A seleção genômica, ou seleção genômica ampla foi proposta com a finalidade de otimizar o processo de melhoramento genético utilizando simultaneamente dados fenotípicos e genotípicos por meio de marcadores SNP’s, presentes em todo o genoma. Várias metodologias têm sido implementadas, principalmente utilizando regressão linear e considerando os efeitos dos marcadores fixos (BLUP, LS, etc.) ou considerando os efeitos aleatórios (Bayes A, Bayes B, LASSO Bayesiano, dentre outras). Em geral, tais metodologias analisam cada característica individualmente, ou seja, os resultados obtidos são válidos apenas para uma única variável. Entretanto, em programas de melhoramento o interesse recai em ganhos para mais de uma característica conjuntamente. Dessa forma, desenvolver uma abordagem que trabalhe com análises que considerem várias características simultaneamente pode ser interessante, visto que poderíamos estudar um conjunto de caracteres importantes conjuntamente. Uma metodologia possível de ser utilizada para este fim é a análise fatorial (ou análise de fatores - AF). Tal metodologia permite a obtenção de variáveis latentes (fatores comuns) que representam um conjunto das variáveis originais. A partir de então, análises posteriores podem ser realizadas utilizando as variáveis latentes criadas. Diante do exposto, o principal objetivo deste trabalho foi propor a utilização da análise de fatores para criação de variáveis latentes altamente associadas às variáveis fenotípicas originais, de modo que possamos estimar o mérito genético para os indivíduos considerando várias variáveis simultaneamente. Objetivou-se também comparar os resultados obtidos com aqueles advindos das análises individuais. Para tanto, foram utilizados dados fenotípicos e genotípicos provenientes de 345 suínos obtidos pelo cruzamento das raças Piau e Comercial, oriundos da Granja de Melhoramento de Suínos do Departamento de Zootecnia da Universidade Federal de Viçosa (UFV), no período de novembro de 1998 a julho de 2001, utilizando 237 marcadores SNP’s e 41 variáveis fenotípicas. No primeiro capítulo foi aplicada a análise de fatores para verificar a estrutura de associação entre as variáveis e averiguar a que fator cada variável pertence, onde são identificados os fatores interpretáveis. No segundo capítulo, técnicas bayesianas de seleção genômica ampla foram aplicadas nas variáveis latentes interpretáveis para predição do mérito genético e seleção dos indivíduos, comparando assim os resultados com o que foi encontrado para as variáveis fenotípicas individualmente. Os resultados obtidos indicam que a aplicação da análise de fatores para obtenção de variáveis latentes que representam um conjunto de caracteres para posterior uso em seleção genômica ampla se mostrou eficiente, visto que apresentou valores de acurácia semelhantes aos encontrados considerando as análises individuais das variáveis e alta concordância entre os indivíduos selecionados considerando a variável latente e as variáveis individuais.Item Análise de fatores para redução de dimensionalidade em estudos de predição genômica(Universidade Federal de Viçosa, 2022-12-12) Oliveira, Cristiano Ferreira; Cruz, Cosme DamiãoO conceito de seleção genômica tem como base o desequilíbrio de ligação (LD) entre locos de características quantitativas (QTLs) e marcadores. Uma variação genética que se relaciona com a forma que o fenótipo é expresso conduz a múltiplas associações estatísticas em marcadores próximos em termos de ligação fatorial ou de desequilíbrio, podendo estas associações ser ou não de causa e efeito. Assim ao construir modelos preditivos, em geral não é conhecido quais SNPs possuem de fato associação de causa e efeito com o fenótipo de interesse, consequentemente o modelo é construído utilizando todas as informações genotípicas. Com o intuito de aumentar a acurácia dos modelos de predição, diferentes abordagens de seleção de marcadores foram propostas. São estratégias utilizadas para isto selecionar SNPs relatados anteriormente em estudos de associação para a característica de interesse, estimar a significância dos SNPs no conjunto de dados para cada característica utilizando um modelo preditivo e o efeito dos marcadores estimados pelo modelo, ou a seleção subconjuntos dos marcadores uniformemente espaçados ao longo do genoma. Dentre as abordagens citadas anteriormente, a seleção uniformemente espaçada ao longo do genoma é a mais versátil, uma vez que um painel de baixa densidade formado por meio dela pode ser utilizado em estudos de predição de valores genéticos de qualquer característica, diferentemente das outras abordagens citadas. Porém esta seleção está sujeita a possibilidade de excluir por completo blocos de haplótipos em LD relacionados com o fenótipo de interesse. Este trabalho foi desenvolvido com o objetivo de propor uma abordagem de seleção de marcadores espaçados dentro de blocos de haplótipos construídos utilizando Análise de Fatores (AF). Mostramos, utilizando dados simulados que a Análise de Fatores pode ser utilizada para construir os blocos de haplótipos, sendo ela capaz de sintetizar a relação linear entre marcadores e criar fatores comuns que podem ser interpretados como blocos de LD. Em seguida utilizamos em um conjunto de dados de soja, contendo 41985 marcadores do tipo SNPs com informação de 20087 acessos de soja, esta abordagem para construir os blocos e então foi feito a seleção espaçada dentro dos blocos formados a partir da AF. Três painéis de SNPs foram considerados, contendo 1%, 5% e 100% dos marcadores. Para avaliar o êxito desta abordagem, foi considerado a acurácia em uma tarefa de predição do valor fenotípico dos indivíduos utilizando os painéis reduzidos e o painel completo. Os resultados mostram que ao utilizar os painéis reduzidos não há diferença significativa de acurácia seletiva comparado a acurácia obtida utilizando o painel completo e para uma das características avaliadas também não foi encontrada diferença significativa para acurácia preditiva. Palavras-chave: SNP. GWS. Seleção de Marcadores. Análise Fatorial. Soja. Aprendizado de Máquina. Blocos de Haplótipos.Item Análise de sobrevivência com censura intervalar aplicada na germinação de sementes de pitaia(Universidade Federal de Viçosa, 2024-08-16) Silvério, Sara; Martins Filho, Sebastião; http://lattes.cnpq.br/2727150015041728Devido à presença de dados censurados nos ensaios de germinação de sementes, os métodos convencionais de análise de dados podem não ser a escolha mais apropriada. Uma alternativa recomendada é a aplicação da análise de sobrevivência. Em muitos casos, a determinação exata do momento da falha não é possível devido às observações serem realizadas em intervalos de tempo, caracterizando a censura intervalar. Além disso, pode ocorrer que todas as unidades experimentais sejam observadas nos mesmos intervalos de tempo, caracterizando um caso particular de censura intervalar conhecido como dados grupados. No Capítulo 1, este trabalho teve como objetivo fornecer uma revisão geral da análise de sobrevivência, enfatizando a censura intervalar e abrangendo técnicas não paramétricas, paramétricas e semiparamétricas. O Capítulo 2 teve como objetivo aplicar e avaliar métodos de análise de sobrevivência com censura intervalar, utilizando dados de quatro experimentos de germinação de sementes de pitaia (Hylocereus spp.) obtidos da base de dados Mendeley. Nos experimentos foram realizadas contagens semanais durante quatro semanas. As sementes que não germinaram até o final desse período foram consideradas censuradas (não germinadas) à direita. Foram aplicadas as seguintes técnicas: i) o algoritmo EMICM para avaliar o efeito combinado do tempo de armazenamento e do tipo de luz; ii) regressão paramétrica para analisar o efeito conjunto do local e do tempo de armazenamento; iii) regressão semiparamétrica para examinar o impacto do método de extração das sementes; e vi) regressão discreta em dados grupados para avaliar o efeito combinado do armazenamento e da temperatura. As técnicas aplicadas permitiram avaliar esses fatores na germinação de sementes de pitaia. Dessa forma, análise de sobrevivência demonstrou ser uma ferramenta valiosa para lidar com dados censurados intervalares em estudos de germinação, destacando a importância da seleção adequada do método de análise, de acordo com a natureza dos dados e os objetivos do estudo. Palavras-chave: Hylocereus spp.; Armazenamento; Temperatura; Tipos de luz; Extração de semente; Tempo até o evento.Item Análise de sobrevivência do tomateiro a Phytophthora infestans(Universidade Federal de Viçosa, 2008-09-05) Araujo, Maria Nilsa Martins de; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248466E9; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Cota, Luciano Viana; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4778995H6A requeima causada por Phytophthora infestans caracteriza-se por ser uma doença agressiva e de grande impacto destrutivo, podendo limitar ou até mesmo impedir o cultivo econômico do tomateiro sob condições de alta umidade e baixas temperaturas. Diante dos problemas que a requeima pode provocar às lavouras de tomate, este trabalho teve por objetivos: 1) ajustar modelos para descrever o progresso da doença e formar grupos de acessos de tomateiro com curvas semelhantes; 2) estimar dados referentes ao número de dias até atingir 5% de severidade da doença, por meio de regressão inversa; 3) ajustar curvas de sobrevivência por meio do estimador de Kaplan-Meier para grupos de acessos e compará-las mediante o uso do teste Logrank; 4) ajustar curvas de sobrevivência por meio de modelos probabilísticos e compará-las com a técnica não-paramétrica de Kaplan-Meier. Utilizando dados reais sobre a requeima do tomateiro, foi possível ajustar o modelo exponencial (Y = y0 exp (rX)) para descrever o progresso da doença. As médias das estimativas dos parâmetros foram submetidas à análise de agrupamento pelo método Centróide, o que gerou 10 grupos de acessos, sendo o tempo até a incidência de 5% da doença calculado via regressão inversa. Foram utilizadas técnicas não-paramétricas para estimar a função de sobrevivência por meio do estimador de Kaplan-Meier e para comparar as curvas de sobrevivência pelo teste Logrank. Foi também ajustada a função de sobrevivência, empregando-se os modelos probabilísticos Exponencial, Weibull e Log-normal, os quais foram comparados por meio do Teste da Razão da Verossimilhança (TRV), considerando-se o modelo Gama generalizado por ser caso geral para esses modelos. A metodologia utilizada permitiu ajustar o modelo Exponencial para descrever o progresso da requeima do tomateiro e agrupar os acessos estudados em 10 grupos. O acesso BGH-6 sofreu um progresso de doença menor que os demais, caracterizando-se, assim, sua maior resistência à enfermidade. A regressão inversa possibilitou estimar o tempo até a ocorrência de 5% da severidade da requeima do tomateiro. Pela técnica não-paramétrica de Kaplan-Meier, foi possível estimar as curvas de sobrevivência dos acessos de tomateiro pertencentes aos grupos 1, 2, 4, 6 e 8. Utilizando o teste Logrank, pode-se concluir que a maioria das comparações duas a duas foi significativa (p<0,05), exceto nas comparações dos grupos 2x4, 4x8 e 6x8. O uso dos modelos probabilísticos Exponencial, Weibull e Log-normal possibilitou a estimação das curvas de sobrevivência nos grupos 2, 4, 6 e 8, exceto no grupo 4, em que o modelo Weibull não foi adequado. Comparando os modelos probabilísticos com a técnica não-paramétrica, as curvas dos modelos probabilísticos dos grupos 2 e 4 apresentaram ajustes satisfatórios com relação à curva estimada por Kaplan-Meier.