Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
Item Abordagem estatística de variáveis climáticas de Viçosa - MG(Universidade Federal de Viçosa, 2017-02-15) Lacerda, Maurício Silva; Emiliano, Paulo César; http://lattes.cnpq.br/7403859031624608Conhecer o comportamento de variáveis climáticas como a temperatura e o índice de chu- vas de uma cidade ou região é de grande importância para que haja melhor planejamento e tomadas de decisões futuras, por este motivo estudos destas variáveis estão sempre em evidência. Desta forma, tem-se como objetivo geral realizar um estudo de algumas carac- terísticas do clima da cidade de Viçosa-MG, por meio de séries temporais, com enfoque nas temperaturas máximas e mínimas e no nível de precipitação pluviométrica, com obje- tivo específico de identificar alterações nestes fatores. Para isso analisou-se um conjunto de dados históricos acerca do clima da cidade com registros desde janeiro de 1968 até julho de 2016, iniciando o tratamento dos dados calculando a média mensal para as tem- peraturas e o total mensal para a precipitação, em seguida foi aplicado o teste de Dickey- Fuller aumentado para análise da tendência, e uma decomposição espectral da série nas frequências de Fourier para detectar sazonalidade. Posteriormente, escolheu-se a classe dos modelos SARIMA e as suas ordens escolhidas por meio dos critérios de informação bayesiano (BIC) e Akaike corrigido (AICc). O modelo escolhido foi verificado através de uma análise residual com os testes de Shapiro-Wilk e Ljung-Box. Para a série histórica da média mensal da temperatura máxima o modelo SARIM A(2, 1, 2) × (0, 1, 1) se apresen- tou com bom ajuste. As séries da média mensal da temperatura mínima e da precipitação pluviométrica total mensal necessitaram de um modelo que ajustassem os resíduos para que os pressupostos da modelagem fossem satisfeitos, com isso a primeira teve sua corre- lação serial modelada pelo SARIM A(1, 1, 2) × (0, 1, 1) e seus resíduos pelo ARCH(2) e a segunda série teve os modelos SARIM A(1, 0, 0) × (0, 1, 1) para a ajustar a correla- ção serial e ARCH(2) para os resíduos. Com o presente estudo conclui-se que a cidade de Viçosa-MG teve uma elevação acima de 1°C na média mensal de suas temperaturas máximas e mínimas, enquanto que o nível de precipitação não sofreu alterações ao longo do tempo estudado.Item Abordagem matemática na análise de dados de área aplicada à variável malária em Moçambique(Universidade Federal de Viçosa, 2015-10-07) Chipenete, Cláudio Francisco; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/2557621925960438Ao se analisar os dados de área, um dos principais interesses é entender sua estrutura ou distribuição no espaço e, se existe alguma dependência ou estrutura bem definida entre as diversas áreas na região em estudo. Para mensurar essa dependência fez-se uma análise de padrões utilizando a autocorrelação espacial. O principal objetivo do trabalho foi abordar no enfoque matemático, as técnicas e procedimentos estatísticos na análise espacial de dados de área utilizando o método tradicional para o cálculo do índice de Moran e o método de três passos. Buscou-se também verificar e analisar a existência de algum padrão espacial definido em Moçambique associado a variável malária. A malária tem sido uma das principais causas de internamento nos hospitais e centros de saúde nos últimos anos, igualmente, das mortes da população. Analisar sua distribuição e relacionamento entre diferentes distritos do país poderá contribuir para minimizar os efeitos dessa doença. Os dados foram obtidos do Inquérito Demográfico e de Saúde de Moçambique (IDS) realizado em 2011. Na análise estatística foi possível identificar regiões cujos distritos se assemelhavam por possuírem taxas médias baixas de malária, formando agrupamentos, a saber, nas regiões sul, extremo sul, e norte de Moçambique. Para os demais distritos, verificou-se uma distribuição aleatória de casos da malária. No entanto, foi possível identificar distritos representados pelas cidades de Maputo, Matola e Beira com maior taxa de malária em relação aos demais.Item Análise biométrica de acessos de Capsicum chinense Jacq. com ênfase na diversidade genética(Universidade Federal de Viçosa, 2016-02-23) Oliveira, Ana Carolina Ribeiro de; Cecon, Paulo Roberto; http://lattes.cnpq.br/0231423029429573Os estudos de divergência genética são fundamentais para subsidiar ações de conservação, de utilização dos recursos genéticos e posterior aplicação em programas de melhoramento, visando à obtenção de genótipos superiores. Sendo assim, este trabalho teve por objetivo avaliar a diversidade genética de acessos de pimenta, Capsicum chinense Jacq., por meio de técnicas multivariadas de agrupamentos utilizando os métodos hierárquicos (UPGMA e Ward) e de otimização (Tocher e Tocher modificado). O experimento foi conduzido na área experimental do setor de olericultura do Departamento de Fitotecnia da Universidade Federal de Viçosa (UFV), sob delineamento inteiramente casualizado, com quatro repetições e uma planta por parcela. Foram avaliados 11 acessos de C. chinense registrados no Banco de Germoplasma de Hortaliças (BGH/UFV), com base em 11 caracteres. Os resultados indicaram pelos métodos hierárquicos a formação de dois grupos, sendo que 72,73% dos acessos pertenciam ao grupo I e 27,27% ao grupo II; e ambas as estruturas de agrupamento foram validadas pelo coeficiente de correlação cofenética (r). Os métodos de otimização, Tocher e Tocher modificado, reuniram os acessos em seis e quatro grupos, respectivamente, revelando maior diversidade dos acessos em relação aos métodos anteriores. Assim, independente do método utilizado foi possível identificar os acessos mais divergentes e, consequentemente, contribuir para futuras pesquisas de cruzamento buscando híbridos com maior efeito heterótico.Item Análise da detecção e da influência de outliers na avaliação da acurácia posicional de produtos cartográficos(Universidade Federal de Viçosa, 2021-08-27) Cristo, Sabrina Lourdes Pereira de; Santos, Nerilson Terra; http://lattes.cnpq.br/4426790564356034Outliers são dados que se diferem do conjunto de dados ao qual pertence e podem ser identificados aplicando métodos próprios para esta finalidade. A detecção de candidatos a outliers é objeto de interesse de várias áreas, dentre elas o controle de qualidade cartográfica, que tem por objetivo avaliar a qualidade de um produto cartográfico e assegurar para qual finalidade o produto cartográfico pode ser utilizado. Um dos elementos do controle de qualidade cartográfica é a acurácia posicional, que mede a qualidade da posição geográfica de dados geoespaciais. A análise da qualidade da posicional deve ser avaliada em termos de precisão e tendência. A precisão é feita seguindo as recomendações do Decreto 89.817, ET- ADGV e ET-CQDG, enquanto para a tendência podem ser utilizados testes inferenciais, como o Teste t de Student, e a estatística espacial, usando a média direcional e a variância circular. A presença de outliers pode comprometer tanto a precisão quanto a tendência e apesar da importância da detecção de candidatos a outliers, essa etapa não é bem definida nas normas, que não a tratam como obrigatória. Dessa forma, objetivou-se analisar o impacto da detecção de candidatos a outliers na avaliação da acurácia posicional e avaliar o desempenho de diferentes métodos de detecção de candidatos a outliers. Para isso, foram avaliados cinco produtos cartográficos quanto a sua acurácia posicional de duas formas, a primeira sem realizar a etapa de detecção de candidatos a outliers, fazendo a análise de precisão e tendência, e a segunda maneira acrescentando a detecção de candidatos a outliers, aplicando sete métodos para cada base de dados, sendo eles: Método 3σ, Diagrama Box-Plot, Método Standard Deviation, Método Hampel, Teste de Dixon, Teste de Grubbs e Teste de Chauvenet. Com isso, notou-se que a presença de pontos outliers afeta a qualidade do produto cartográfico e que após sua remoção, a classificação dos dados quanto à acurácia posicional tem uma melhoria. Palavras-chave: Outliers. Controle de Qualidade Cartográfica. Acurácia Posicional.Item Análise de componentes principais e análise de fatores em acessos de Capsicum annuum L. no estudo de variabilidade genética(Universidade Federal de Viçosa, 2023-08-30) Santos, Raquel Cordeiro; Cecon, Paulo Roberto; http://lattes.cnpq.br/8324411827990437As pimenteiras pertencem a família Solanácea e ao gênero Capsicum, a qual representa grande variabilidade de plantas. As pimentas são consumidas em todo o mundo e em razão de seus diversos usos e demanda de mercado é necessário buscar opções de maior qualidade e produtividade, o que pode ser feito pela escolha de genótipos superiores. O objetivo dessa pesquisa foi estudar a variabilidade genética de acessos de pimenta (C. annuum) por meio de técnicas de análise de componentes principais e análise de fatores. Utilizando o delineamento experimental inteiramente casualizado, com quatro repetições foram analisados nove acessos de Capsicum annuum L., são eles: Pimenta Vulcão, Pimenta Cayene, Pimenta Peter, Pimenta Picante para vaso, Pimenta Jamaica Yellow, Pimenta Doce Italiana, Pimentão Quadrado, Pimentão Cascadura Ikeda e Pimentão Rubi Gigante. As características avaliadas foram: peso total do fruto (PT, g), comprimento do fruto (COM, mm), largura do fruto (LAR, mm), espessura do pericarpo (ESP, mm), número de sementes por fruto (NS), massa da matéria total do fruto fresca (MF, g), Massa da matéria total do fruto maduro seco (MS, g), Teor de sólidos solúveis (BRIX), Teor de Vitamina C (VIT, mg100g −1 ). Foi aplicada a técnica de análise multivariada denominada de componentes principais (ACP), que permitiu reduzir a dimensão da amostra, pela qual foram retidos dois componentes que juntos explicaram mais de 90% da variabilidade contida nos dados. A análise de divergência genética entre os acessos foi realizada por meio da técnica de análise multivariada denominada de análise de fatores (AF), seguido da rotação Varimax, levando a identificação de três grupos geneticamente divergentes o que permite abordagens mais direcionadas para otimizar as características-chave relacionadas ao mercado de pimentas. Palavras-chave: Análise multivariada. Variabilidade genética. Pimenta.Item Análise de dados de RNA-Seq com diferentes números de fatores e repetições(Universidade Federal de Viçosa, 2015-07-22) Souza, Vladimir Barbosa Carlos de; Peternelli, Luiz Alexandre; http://lattes.cnpq.br/7804746265517309A tecnologia RNA-Seq mostrou-se ser revolucionária para o estudo de expressão gênica. Porém, mais estudos na literatura sobre a análise de dados de RNA-Seq são necessários, até mesmo porque se trata de um método de elevado custo. Devido a este alto custo, é importante o aproveitamento das amostras disponíveis para concluir sobre mais fatores e suas interações. Este trabalho tem como objetivo realizar um comparativo do desempenho da análise de identificação de DEGs (genes diferencialmente expressos) em experimentos com diferentes números de fatores e repetições, mas todos com o mesmo número de amostras, ou seja, com o mesmo custo. Para as análises, foram simulados conjuntos de dados provenientes de experimentos com diferentes números de fatores e repetições. Para a realização dessas simulações foi utilizado o pacote TCC, desenvolvido para o software livre R, para a normalização dos dados também foi utilizado o TCC, e para a identificação dos DEGs foi utilizado o pacote DESeq, também desenvolvido para o R. Por último, o desempenho das análises de cada experimento foi calculado utilizando-se curvas ROC (Receiver Operating Characteristics), usando-se o pacote ROCR, também disponível para o R. Após o cumprimento da metodologia, pôde-se observar que, na ausência de interação entre fatores, não ocorre perda de desempenho das análises ao adicionar mais fatores, e, quando existe interação entre fatores, ocorre essa perda. Portanto, o uso de mais fatores, ao custo de se ter menos repetições, pode ser vantajoso.Item Análise de estilo baseada em retornos: um estudo aplicado aos fundos de previdência complementar oferecidos pelo instituto Agros(Universidade Federal de Viçosa, 2021-11-04) Prates, Carlos Victor Bragatto; Barbosa, Eduardo Campana; http://lattes.cnpq.br/4525845624417719A introdução do Plano Real, em 1994, promoveu uma profunda mudança no cenário econômico nacional, bem como na postura do cidadão brasileiro, no que se refere a gestão do seu patrimônio pessoal e a escolha de estratégias e instrumentos financeiros, que permitam uma administração eficiente do mesmo. Nesse sentido, uma categoria de investimento que vem se destacando é a dos planos de previdência privada, uma importante alternativa para auxiliar o brasileiro no planejamento e no acúmulo de recursos para o futuro. Logo, o objetivo deste trabalho é aplicar a metodologia da Análise de Estilo Baseada em Retornos ou RBSA (do inglês, Return Based Style Analysis), para avaliar as estratégias de investimento ou de alocação de recursos e os retornos de dois planos previdenciários (B e CD) oferecidos pelo Agros, um Instituto da UFV de Seguridade Social, que oferece e administra planos de previdência privada e de saúde, com o intuito de suplementar os benefícios pagos pela previdência social aos servidores e ex-servidores da Universidade Federal de Viçosa (UFV). A referida metodologia utiliza um modelo de regressão linear múltipla, que através da imposição de algumas restrições paramétricas, busca estimar o percentual de alocação de um fundo a determinadas classes de ativos, descritas à priori nos documentos regulatórios do mesmo. Palavras-chave: Economia. Gestão. Investimentos. Restrições paramétricas. Regressão linear múltipla.Item Análise de fatores aplicada a predição genômica considerando seleção de marcadores em Oryza sativa(Universidade Federal de Viçosa, 2021-02-19) Fialho, Izabela Clara; Azevedo, Camila Ferreira; http://lattes.cnpq.br/1414652656084772O arroz asiático Oryza sativa é um dos alimentos mais consumidos em grande parte do mundo. Assim, o crescimento populacional justifica o interesse dos pesquisadores em tornar as variedades deste arroz altamente produtivas. Para alcançar esse objetivo, a Seleção Genômica Ampla (Genome Wide Selection - GWS) é uma ferramenta utilizada pelos programas de melhoramento. A GWS emprega dados fenotípicos e genotípicos por meio de marcadores SNPs (Single Nucleotide Polymorphism) amplamente distribuídos no genoma. Porém, nem todos estes SNPs estão associados as características de relevância para o pesquisador, o que torna necessário o uso de métodos estatísticos para a seleção de marcadores. O BLUP genômico (Genomic best linear unbiased prediction – G-BLUP) é um método amplamente aplicado a predição genômica, e quando este está associado a seleção de marcadores dá origem ao chamado G-BLUP supervisionado. Dessa forma, o presente trabalho objetivou-se avaliar a eficiência na predição genômica ao combinar a análise de fatores e a seleção de marcadores via G-BLUP supervisionado para grupos de características de interesse. O conjunto de dados de arroz utilizado é público e faz parte de dois projetos, o Projeto OryzaSNP e o Projeto OMAP e está disponível no site http://ricediversity.org/data/. O arquivo contém informações de 28 características fenotípicas e 36.901 marcadores SNPs de 413 indivíduos. Os resultados obtidos indicam que a aplicação da análise de fatores combinada à seleção de marcadores SNPs para a predição genômica se mostrou eficiente, visto que apresentaram valores semelhantes para capacidade preditiva em relação aos encontrados considerando as análises individuais das variáveis (em ambas as análises obteve-se variação entre 0,6 a 0,8 de capacidade preditiva) e alta concordância (acima de 50% de concordância para todos os grupos de marcadores) entre os indivíduos selecionados considerando o fator e as variáveis individuais. Palavras-chave: Arroz. Seleção genômica. G-BLUP.Item Análise de fatores aplicada em estudos de seleção genômica no melhoramento de Coffea canephora(Universidade Federal de Viçosa, 2020-02-20) Paixão, Pedro Thiago Medeiros; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/0114089076153492O Brasil se destaca em âmbito mundial na produção de café. Os incrementos observados em sua produtividade é resultado do aprimoramento de diversas metodologias. Dentre elas, destacam-se os métodos preditivos de valor genético. Estes contribuem significativamente na seleção de genótipos superiores, de forma a aumentar o ganho genético por unidade de tempo. Neste contexto, a seleção genômica ampla (GWS) é uma ferramenta que se destaca, uma vez que permite predizer o fenótipo futuro de um indivíduo baseado apenas em informações de marcadores moleculares. Realizar a seleção de maneira simultânea para várias características é o interesse da maioria dos programas de melhoramento, e a análise de fatores (AF) tem sido utilizada para auxiliar neste fim. A utilização de fatores se justifica devido a existência de correlações genéticas entre as características, as quais podem ser atribuídas aos QTL que têm efeitos pleiotrópicos ou aos QTL estreitamente ligados. Dessa forma, o objetivo deste trabalho foi de avaliar o uso da AF no contexto de GWS, em genótipos de Coffea canephora. Os resultados obtidos da seleção baseada nos fatores foram comparados, por meio da capacidade preditiva, acurácia e do coeficiente de Cohen’s Kappa, com aqueles advindos da análise das variáveis individuais. Para isso, foram utilizados dados fenotípicos e genotípicos de populações compostas por clones dos grupos varietais Conilon e Robusta e por híbridos originados de cruzamentos entre estes grupos, avaliados durante três anos consecutivos (2014 a 2016), e uma densidade de 18111 marcadores SNPs identificados. A partir dos resultados observados, verificou-se que a AF foi eficiente para elucidar as relações entre as características e originar novas variáveis. Os fatores formados são interessantes em termos de seleção, pois além de permitirem interpretações conjuntas, apresentam boas estimativas de capacidade preditiva, herdabilidade e acurácia. Ademais observou-se alta concordância entre os indivíduos selecionados com base nos fatores e aqueles selecionados considerando as variáveis individuais. Entretanto, cabe destacar que, a seleção baseada nos fatores conseguiu selecionar indivíduos de porte mais adequado. Palavras-chave: Predição Genômica. Análise Multivariada. Melhoramento Genético.Item Análise de fatores aplicada na seleção genômica em suínos(Universidade Federal de Viçosa, 2015-02-26) Teixeira, Filipe Ribeiro Formiga; Nascimento, Moysés; http://lattes.cnpq.br/4574646837472160A seleção genômica, ou seleção genômica ampla foi proposta com a finalidade de otimizar o processo de melhoramento genético utilizando simultaneamente dados fenotípicos e genotípicos por meio de marcadores SNP’s, presentes em todo o genoma. Várias metodologias têm sido implementadas, principalmente utilizando regressão linear e considerando os efeitos dos marcadores fixos (BLUP, LS, etc.) ou considerando os efeitos aleatórios (Bayes A, Bayes B, LASSO Bayesiano, dentre outras). Em geral, tais metodologias analisam cada característica individualmente, ou seja, os resultados obtidos são válidos apenas para uma única variável. Entretanto, em programas de melhoramento o interesse recai em ganhos para mais de uma característica conjuntamente. Dessa forma, desenvolver uma abordagem que trabalhe com análises que considerem várias características simultaneamente pode ser interessante, visto que poderíamos estudar um conjunto de caracteres importantes conjuntamente. Uma metodologia possível de ser utilizada para este fim é a análise fatorial (ou análise de fatores - AF). Tal metodologia permite a obtenção de variáveis latentes (fatores comuns) que representam um conjunto das variáveis originais. A partir de então, análises posteriores podem ser realizadas utilizando as variáveis latentes criadas. Diante do exposto, o principal objetivo deste trabalho foi propor a utilização da análise de fatores para criação de variáveis latentes altamente associadas às variáveis fenotípicas originais, de modo que possamos estimar o mérito genético para os indivíduos considerando várias variáveis simultaneamente. Objetivou-se também comparar os resultados obtidos com aqueles advindos das análises individuais. Para tanto, foram utilizados dados fenotípicos e genotípicos provenientes de 345 suínos obtidos pelo cruzamento das raças Piau e Comercial, oriundos da Granja de Melhoramento de Suínos do Departamento de Zootecnia da Universidade Federal de Viçosa (UFV), no período de novembro de 1998 a julho de 2001, utilizando 237 marcadores SNP’s e 41 variáveis fenotípicas. No primeiro capítulo foi aplicada a análise de fatores para verificar a estrutura de associação entre as variáveis e averiguar a que fator cada variável pertence, onde são identificados os fatores interpretáveis. No segundo capítulo, técnicas bayesianas de seleção genômica ampla foram aplicadas nas variáveis latentes interpretáveis para predição do mérito genético e seleção dos indivíduos, comparando assim os resultados com o que foi encontrado para as variáveis fenotípicas individualmente. Os resultados obtidos indicam que a aplicação da análise de fatores para obtenção de variáveis latentes que representam um conjunto de caracteres para posterior uso em seleção genômica ampla se mostrou eficiente, visto que apresentou valores de acurácia semelhantes aos encontrados considerando as análises individuais das variáveis e alta concordância entre os indivíduos selecionados considerando a variável latente e as variáveis individuais.Item Análise de fatores para redução de dimensionalidade em estudos de predição genômica(Universidade Federal de Viçosa, 2022-12-12) Oliveira, Cristiano Ferreira; Cruz, Cosme DamiãoO conceito de seleção genômica tem como base o desequilíbrio de ligação (LD) entre locos de características quantitativas (QTLs) e marcadores. Uma variação genética que se relaciona com a forma que o fenótipo é expresso conduz a múltiplas associações estatísticas em marcadores próximos em termos de ligação fatorial ou de desequilíbrio, podendo estas associações ser ou não de causa e efeito. Assim ao construir modelos preditivos, em geral não é conhecido quais SNPs possuem de fato associação de causa e efeito com o fenótipo de interesse, consequentemente o modelo é construído utilizando todas as informações genotípicas. Com o intuito de aumentar a acurácia dos modelos de predição, diferentes abordagens de seleção de marcadores foram propostas. São estratégias utilizadas para isto selecionar SNPs relatados anteriormente em estudos de associação para a característica de interesse, estimar a significância dos SNPs no conjunto de dados para cada característica utilizando um modelo preditivo e o efeito dos marcadores estimados pelo modelo, ou a seleção subconjuntos dos marcadores uniformemente espaçados ao longo do genoma. Dentre as abordagens citadas anteriormente, a seleção uniformemente espaçada ao longo do genoma é a mais versátil, uma vez que um painel de baixa densidade formado por meio dela pode ser utilizado em estudos de predição de valores genéticos de qualquer característica, diferentemente das outras abordagens citadas. Porém esta seleção está sujeita a possibilidade de excluir por completo blocos de haplótipos em LD relacionados com o fenótipo de interesse. Este trabalho foi desenvolvido com o objetivo de propor uma abordagem de seleção de marcadores espaçados dentro de blocos de haplótipos construídos utilizando Análise de Fatores (AF). Mostramos, utilizando dados simulados que a Análise de Fatores pode ser utilizada para construir os blocos de haplótipos, sendo ela capaz de sintetizar a relação linear entre marcadores e criar fatores comuns que podem ser interpretados como blocos de LD. Em seguida utilizamos em um conjunto de dados de soja, contendo 41985 marcadores do tipo SNPs com informação de 20087 acessos de soja, esta abordagem para construir os blocos e então foi feito a seleção espaçada dentro dos blocos formados a partir da AF. Três painéis de SNPs foram considerados, contendo 1%, 5% e 100% dos marcadores. Para avaliar o êxito desta abordagem, foi considerado a acurácia em uma tarefa de predição do valor fenotípico dos indivíduos utilizando os painéis reduzidos e o painel completo. Os resultados mostram que ao utilizar os painéis reduzidos não há diferença significativa de acurácia seletiva comparado a acurácia obtida utilizando o painel completo e para uma das características avaliadas também não foi encontrada diferença significativa para acurácia preditiva. Palavras-chave: SNP. GWS. Seleção de Marcadores. Análise Fatorial. Soja. Aprendizado de Máquina. Blocos de Haplótipos.Item Análise de variáveis canônicas no software R(Universidade Federal de Viçosa, 2020-10-26) Barbosa, Wagner Faria; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/7238720100539414As variáveis canônicas (𝑉𝐶𝑠) são combinações lineares de variáveis quantitativas utilizadas na discriminação de grupos. No contexto de experimentos executados com tratamentos repetidos sob diferentes delineamentos de casualização, a obtenção das 𝑉𝐶𝑠 pressupõe a realização da MANOVA, uma vez que elas são obtidas pela maximização da relação entre a variação entre e dentro dos tratamentos utilizando, respectivamente, as matrizes de soma de quadrados e produtos do tratamento (𝑯) e do resíduo (𝑬). Funções discriminantes lineares de Fisher (𝐹𝐷𝑠), por outro lado, são combinações lineares de variáveis cujo principal objetivo é a classificação de observações em populações distintamente estabelecidas e conhecidas a priori. Uma vez que existe uma equivalência matemática para obtenção das 𝐹𝐷𝑠 e das 𝑉𝐶𝑠, a obtenção das 𝑉𝐶𝑠 pode ser facilitada pela obtenção de 𝐹𝐷𝑠, que é um método mais comumente encontrado em softwares estatísticos. Neste sentido, o objetivo deste trabalho foi de analisar, por meio da simulação de dados, a equivalência entre as 𝐹𝐷𝑠 e as 𝑉𝐶𝑠, a partir de experimentos instalados sob o DIC, DBC e DQL. A obtenção das 𝑉𝐶𝑠 por meio das 𝐹𝐷𝑠 foi realizada utilizando a função 𝑙𝑑𝑎 implementada no software R com o uso dos valores transformados das observações de cada variável-resposta pela subtração dos efeitos perturbadores (ou seja, de bloco para o DBC, ou de linha e coluna para o DQL) quando eles existiam no modelo estatístico. Além disso, duas padronizações foram utilizadas na obtenção das 𝑉𝐶𝑠. Os resultados proporcionados por ambos os métodos foram comparados por diferentes medidas que incluíram, autovetores, autovalores, importância relativa, além de correlações e da análise de variância e inspeção visual de gráficos bidimensionais, e comprovaram a similaridade das 𝑉𝐶𝑠 com as 𝐹𝐷𝑠, uma vez que não houve prejuízo nem na interpretabilidade nem nas análises realizadas com ambas as funções lineares. Conclui- se, portanto, que as 𝑉𝐶𝑠 podem ser eficientemente obtidas por meio das 𝐹𝐷𝑠 com o uso da função 𝑙𝑑𝑎 e ambos os métodos são equivalentes. Palavras-chave: Análise multivariada. Delineamentos experimentais. Análise discriminante.Item Análise Geoestatística e multivariada para definição de zonas de manejo de cana-de- açúcar (Saccharum officinarum) na Guatemala(Universidade Federal de Viçosa, 2021-06-28) Hernández, Marianna Mendoza; Carneiro, Antônio Policarpo Souza; http://lattes.cnpq.br/7003527687447257As zonas de manejo (ZM) são delimitações de subáreas com características comuns. Dentro da mesma ZM, o potencial de produção pode ser semelhante, ao passo que pode diferir entre as diversas ZM. Estudos recentes em agricultura de precisão consideram eficiente o uso de ZM para a aplicação de fertilizantes baseada na variabilidade espacial dos atributos do solo. Diante disso, os objetivos deste trabalho foram analisar a variabilidade espacial dos atributos físico- químicos do solo em lavoura de cana-de-açúcar (Saccharum officinarum), por meio de Geoestatística e delinear zonas de manejo homogêneas usando análise Geoestatística e multivariada. Foram analisados dados de uma área de produção de cana-de-açúcar de 1.516,33 ha, localizada na fazenda Tehuantepec, no município de Santa Lucía Cotzumalguapa, Escuintla, Guatemala. Foram utilizados 17 atributos físico-químicos, obtidos da amostragem do solo de 153 pontos georreferenciados da área de estudo, na safra 2019-2020. Foram eles: potencial hidrogeniônico, fósforo, cobre, zinco, ferro, manganês, boro, matéria orgânica, capacidade de troca catiônica, cálcio, magnésio, sódio, potássio, saturação de bases, argila, silte e areia. A determinação da dependência espacial de cada variável foi analisada pela análise variográfica, considerando para seu ajuste as variáveis que não apresentaram efeito pepita puro. Os modelos esférico e exponencial foram ajustados aos variogramas experimentais usando o método dos mínimos quadrados. Para avaliar a qualidade do ajuste do modelo teórico dos variogramas, utilizou-se o processo de validação cruzada e, para delimitar as zonas de manejo, foi utilizado o algoritmo fuzzy K-means. A análise de componentes principais (ACP) foi aplicada aos valores preditos dos atributos do solo, obtidos pela técnica de interpolação krigagem como método de entrada de dados para o algoritmo fuzzy K-means. O número de ZM foi definido com os critérios do coeficiente de partição difusa (FPC) e entropia de partição normalizada (NCE). A área estudada apresentou variabilidade espacial para 16 dos 17 atributos de solo. Foram delineadas duas zonas de manejo para a cultura da cana-de-açúcar. Palavras-chave: Agricultura de precisão. Atributos físico-químicos do solo. Componentes principais. Krigagem. Variabilidade espacial. Fuzzy K-means.Item Análises uni e multivariada para avaliação em cruzamentos dialélicos parciais(Universidade Federal de Viçosa, 2020-02-18) Oliveira, Ana Carolina Ribeiro de; Cecon, Paulo Roberto; http://lattes.cnpq.br/0231423029429573A espécie Capsicum annuum L. ocupa uma posição representativa no mercado brasileiro de hortaliças. Assim, com o intuito de atender às exigências do mercado, faz-se necessário o desenvolvimento de novas cultivares, e isso dependerá, da variabilidade genética presente na população em estudo. Neste sentido, o estudo da diversidade genética entre os indivíduos por meio da adoção de técnicas multivariadas, tais como: a análise de agrupamentos e os mapas auto-organizáveis de Kohonen, tornam-se importantes, sobretudo, para seleção de genitores adequados à obtenção de híbridos, com maior efeito heterótico e que proporcionem maior segregação em recombinações, possibilitando o aparecimento de transgressivos. Ademais, o uso de cruzamentos dialélicos propiciam estimativas de parâmetros úteis na seleção de genitores para hibridação e entendimento da ação gênica envolvida na determinação dos caracteres de interesse. As metodologias de Griffing (1956) e Gardner e Eberhart (1966) fornecem informações sobre a capacidade combinatória (geral e específica) e a heterose, respectivamente. Deste modo, objetivou-se avaliar o desempenho de nove genótipos de C. annuum e seus 20 híbridos, obtidos via cruzamentos dialélicos parciais, por meio de caracteres do fruto. O experimento I foi conduzido em casa de vegetação sob delineamento inteiramente casualizado, com quatro repetições. Foram avaliados nove genótipos de Capsicum annuum L., sendo eles: Pimenta Vulcão, Pimenta Cayene, Pimenta Peter, Pimenta Picante para vaso, Pimenta Jamaica Yellow, Pimenta Doce Italiana, Pimentão Quadrado, Pimentão Cascadura Ikeda e Pimentão Rubi Gigante. Os caracteres avaliados foram: peso total do fruto (PTF, g), comprimento do fruto (CF, mm), largura do fruto (LF, mm), espessura do pericarpo (ESP, mm), número de sementes por fruto (NSF), massa da matéria total do fruto fresca (MTF, g) e porcentagem da massa da matéria total do fruto seca (%MTS, g). Os dados obtidos foram submetidos à análise de variância e as médias comparadas pelo critério de Scott-Knott (p < 0,05), para a separação de médias de tratamentos em grupos distintos, por meio da minimização da variação dentro e maximização da variação entre grupos. Para o estudo da diversidade genética, foi adotado a distância de Mahanalobis; os métodos de agrupamento da ligação média entre grupos (UPGMA) e Tocher; e os mapas auto-organizáveis de Kohonen. Observou-se a existência de variabilidade genética entre os genótipos de Capsicum annuum L.; e a formação de dois e quatros grupos, pelos métodos UPGMA e Tocher, respectivamente. A organização da similaridade, estabelecida pelo mapa auto-organizável de Kohonen, apresentou grande potencial no processo de direcionamento de genitores para formação dos dialelos, ao realçar as separações dos grupos de genótipos. O experimento II foi conduzido em casa de vegetação sob delineamento inteiramente casualizado, com quatro repetições. Foram avaliados nove genótipos de Capsicum annuum L. e suas combinações híbridas, por meio de um dialelo parcial (5x4). Pela metodologia de Griffing, adaptada por Geraldi e Miranda Filho (1988), verifica-se que os genótipos ‘Pimentão Quadrado’, ‘Pimenta Jamaica Yellow’, ‘Pimenta Picante para vaso’, ‘Pimenta Cayene’ e ‘Pimenta Peter’ apresentaram os maiores valores de capacidade geral de combinação (CGC), o que os torna potenciais pais em programas de melhoramento de novos híbridos. Os híbridos ‘Pimenta Cayene x Pimentão Cascadura Ikeda’, ‘Pimenta Jamaica Yellow x Pimentão Cascadura Ikeda’ e ‘Pimenta Picante para vaso x Pimentão Quadrado’ destacaram- se pelo melhor desempenho, com as melhores capacidades específicas de combinação e com pelo menos um dos pais com alta CGC, para os caracteres CF, LF e NSF, e %MTS, respectivamente. Adotando-se a metodologia de Gardner e Eberhart, adaptada por Miranda Filho e Geraldi (1984), observa-se que os genótipos ‘Pimentão Quadrado’ e ‘Pimenta Picante para vaso’ apresentaram maior potencial per se, considerando todos os caracteres, e entre os efeitos de heterose específica os cruzamentos ‘Pimenta Vulcão x Pimentão Quadrado’ e ‘Pimenta Cayene x Pimentão Quadrado’ têm efeitos positivos para 77% dos caracteres avaliados. Por fim, foram realizados o ajuste de modelos de regressão não linear para descrever o crescimento de pimentas (Capsicum annuum L.) ao longo do tempo, por meio do método dos mínimos quadrados ordinários (MQO); a identificação do modelo com melhor ajuste e a comparação do modelo obtido por MQO com o modelo via regressão quantílica não linear (RQ), nos quantis 0,25, 0,5 e 0,75. Como resultados, os modelos de regressão não linear Logístico e von Bertalanffy foram indicados para descrever o crescimento de pimentas. A RQ foi eficiente para ajustar modelos de crescimento, quando comparada à regressão não linear obtida por mínimos quadrados ordinários. Palavras-chave: Capsicum annuum L. Regressão quantílica. Modelos não lineares. Mapa de Kohonen. Diversidade genética.Item Aplicação do fatorial fracionado no estudo de fatores relacionados ao preparo de bebida não alcoólica(Universidade Federal de Viçosa, 2014-11-06) Silva, Lucas Dias da; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/1497922417511582Para o desenvolvimento de novos produtos, há a necessidade de experimentar muitos fatores, cujos efeitos ainda não são conhecidos. Portanto, é importante, a princípio instalar o experimento fatorial completo 2k ou o fatorial fracionado 2k-p, para k fatores estudados, que, provavelmente, possibilitará a seleção dos fatores (< k) mais importantes para o estudo. Para avaliar a qualidade da bebida em cápsula, foram investigados cinco fatores não passíveis de controle pela indústria: temperatura do copo (A), pH da água (B), material do copo (C), temperatura da cápsula (D) e inclinação do copo (E). Para estudar os efeitos principais e os das interações duplas destes cinco fatores sobre três variáveis-resposta (nível de carbonatação, temperatura e variação do teor de sólidos solúveis), foi conduzido um experimento fatorial fracionado 25-1, de resolução V, segundo o delineamento inteiramente casualizado, sem repetição, com os seguintes níveis por fator: a– = 18 oC, a+ = 32 oC, b– = 6, b+ = 9,5, c– = plástico, c+ = vidro, d– = 5 oC, d+ = 32 oC, e– = ausente, e+ = presente. As análises estatísticas das respostas avaliadas no experimento foram realizadas de acordo com o método de Lenth (1989) para α = 0,05. O nível de carbonatação foi influenciado negativamente e apenas pela temperatura da cápsula. Portanto, para maximizá-lo, recomendou-se a menor temperatura da cápsula igual a 5 oC. A temperatura da bebida sofreu efeitos significativos da temperatura da cápsula, das interações entre as temperaturas do copo e da cápsula (antagonismo) e entre o material e a inclinação do copo (sinergismo). Para esta variável, foram recomendadas duas combinações de níveis: com copo de plástico inclinado e com copo de vidro não inclinado, ambos a 18 oC, com cápsula a 5 oC e com pH da água igual a 6,0 ou 9,5. E para a variação do teor de sólidos solúveis, foi manifestado efeito positivo do pH da água. Para minimizá- la, recomendou-se o menor valor de pH igual a 6,0, independentemente do níveis dos demais fatores. Para atender as especificações das três variáveis avaliadas, simultaneamente, foram recomendados dois tratamentos: temperatura do copo em 18 oC, pH da água igual a 6,0 e temperatura da cápsula igual a 5 oC, combinadas com copo de plástico inclinado ou com copo de vidro sem inclinação. A fim de validar as recomendações dos dois tratamentos, foi avaliada a desejabilidade de acordo com os critérios técnicos definidos pela empresa para as três variáveis- resposta. Novamente, os resultados dos melhores tratamentos se repetiram, com, aproximadamente, 83% dos desejos de qualidade atingidos. Como consequência dos resultados obtidos em nível experimental, o projeto de desenvolvimento desta inovação em preparo de bebidas se mostrou viável do ponto de vista técnico, desde que os consumidores obedeçam às recomendações estabelecidas pela empresa.Item Aprendizado de máquina e estatístico na discriminação de populações na presença de matrizes de covariâncias heterogêneas e vetores aleatórios não normais multivariados(Universidade Federal de Viçosa, 2019-07-22) Carvalho, Vitor Prado de; Nascimento, Moysés; http://lattes.cnpq.br/1140674951892263Na análise discriminante, é avaliado a diversidade ou classificação dos indivíduos nas populações, para tal um grande número de metodologias está disponível, dentre as quais destacam-se os métodos multivariados de análise discriminante que têm sido utilizados em estudos preditivos da diversidade genética. Tal metodologia visa identificar as populações nas quais um indivíduo deva pertencer, admitindo previamente, que este indivíduo pertença a uma das populações avaliadas, no entanto esta análise pressupõe que as populações sejam provenientes de uma distribuição normal multivariada. Dentre as diversas metodologias de análise discriminante destaca-se a função discriminante linear de Fisher que possui para sua utilização a pressuposição de que as matrizes de covariância entre as populações sejam homogêneas, e na quebra desse pressuposto outras abordagens são necessárias como a análise discriminante quadrática ou auxilio de métodos computacionais como os de aprendizado de máquina. Desse modo o presente trabalho visa avaliar a robustez da função discriminante linear de Fisher na presença de matrizes de covariâncias heterogêneas e vetores aleatórios não normais multivariados, já que na literatura não exemplifica o critério de escolha quanto ao uso de tal função. Os dados foram gerados por meio de simulação com cenários caracterizados por matrizes de covariâncias heterogêneas e vetores aleatórios não normais multivariados e seus resultados foram comparados com outras metodologias de mesmo proposito, tais como a Análise Discriminante Quadrática, Redes Neurais Artificiais, Máquina de Vetor Suporte e Árvore de Classificação. De acordo com os resultados foi possível observar que as técnicas para classificação de indivíduos devem ser utilizadas seguindo suas pressuposições. Especificamente, para situações em que os dados apresentam normalidade multivariada e heterocedasticidade de matrizes de covariâncias, a função discriminante Quadrática apresentou melhores resultados quanto ao valor de Taxa de Erro Aparente (TEA). Para situações em que os dados apresentaram distribuição Poisson multivariada e homogeneidade de matrizes de covariância, a Função Discriminante de Fisher apresentou menores valores de TEA. As demais metodologias, Redes Neurais Artificiais, Máquina de Vetor Suporte, Árvores de Decisão e seus refinamentos (Poda, Bagging e Random Forest) e Boosting apresentaram valores razoáveis de TEA e se apresentam como técnicas alternativas para situações em que os pressupostos necessários para aplicação das técnicas da Função Discriminante de Fisher e da Função Discriminante Quadrática não são atendidos.Item Aprendizagem de máquina e técnicas multivariadas no estudo da qualidade do carvão vegetal(Universidade Federal de Viçosa, 2019-02-18) Pereira, Kaléo Dias; Carneiro, Antônio Policarpo Souza; http://lattes.cnpq.br/6853931004500288Os estudos sobre as variáveis que determinam a qualidade do carvão vegetal e a influência do material de origem norteiam o planejamento de programas de seleção de melhores genótipos para a produção de carvão. O emprego de novos métodos de análise que se adequem ao estudo das propriedades do carvão vegetal, possibilita a avaliação dos dados por ângulos diferentes e amplia as possibilidades das pesquisas na área. Nesse sentido, o objetivo do presente trabalho foi utilizar procedimentos de aprendizagem de máquina e técnicas multivariadas na análise do rendimento e qualidade do carvão vegetal produzido a partir de clones de Corymbia. As amostras analisadas foram obtidas a partir de um plantio clonal com sete anos de idade estabelecido no município de Dionísio, MG. No primeiro capítulo são apresentados os resultados da utilização do algoritmo random forest no estudo da influência das propriedades da madeira sobre o rendimento e propriedades de qualidade do carvão vegetal, bem como a comparação da acurácia dos valores preditos pelo random forest com os preditos pelo support vector regression e regressão linear múltipla. As variáveis teor de holocelulose, relação cerne/alburno e densidade básica da madeira foram as mais importantes para a modelagem via aprendizagem de máquina. Quanto a acurácia, o random forest foi superior aos demais métodos considerando o coeficiente de determinação, correlação linear entre valores observados e preditos, erro médio absoluto e raiz quadrada do erro quadrático médio, inclusive mostrando desempenho adequado para que seja viável a utilização do algoritmo para a estimação das propriedades do carvão vegetal. No segundo capítulo relata-se o emprego da função discriminante de Fisher na classificação dos clones de Corymbia quanto ao potencial para a produção de carvão vegetal em termos de rendimento e qualidade. Os dados foram inicialmente testados quanto às pressuposições de normalidade multivariada e homogeneidade de matrizes de variâncias/covariâncias, para em seguida aplicar a análise de variância multivariada (MANOVA). Pelos resultados da MANOVA, constatou-se que existe diferença no campo multivariado entre os clones e, a partir das matrizes de soma de quadrados e produtos do resíduo e do efeito de clones, foram estimados os coeficientes das duas primeiras funções discriminantes, que juntas retiveram aproximadamente 80% da informação contida no conjunto de dados. As duas funções discriminantes foram utilizadas para calcular duas variáveis canônicas que são funções das variáveis observadas do carvão vegetal. Comparando os clones por meio das médias das variáveis canônicas, verificou-se que o genótipo AMF 1119 é o mais indicado para a produção de carvão vegetal.Item Associação genômica via regiões cromossômicas sob a abordagem bayesiana(Universidade Federal de Viçosa, 2023-02-16) Rossinol, Aline Marçal; Azevedo, Camila Ferreira; http://lattes.cnpq.br/5027877150927165Com os avanços na biotecnologia se tornou possível novas descobertas na área da biologia molecular, o que favorece cada vez mais os estudos de associação genômica ampla (Genome Wide Association Studies - GWAS). A GWAS utiliza marcadores moleculares, principalmente, os SNPs (Single Nucleotide Polymorphism), tendo como objetivo identificar as variantes causais no genoma e investigar as regiões do cromossomo em que estas variantes se encontram. Um dos principais métodos estatísticos em GWAS é o método via regressão em marcas únicas, que visa estudar a associação entre o fenótipo e um único marcador. No entanto, esse método apresenta problemas estatísticos, como, por exemplo, necessidade de grandes amostras e alta taxa de falsos positivos. Atualmente, os métodos utilizando grupos de marcadores vêm ganhando cada vez mais destaque, devido ao fato de que, os marcadores moleculares podem estar em alto desequilíbrio de ligação (Linkage Disequilibrium – LD) entre si e, com isso, influenciar conjuntamente o fenótipo. Um desses métodos é o Mapeamento de Herdabilidade Regional (Regional Heritability Mapping - RHM). Atualmente, os estudos de associação sob abordagem Bayesianas e utilizando grupos de marcadores, ou regiões genômicas, vêm ganhando cada vez mais destaque. Isto ocorre devido ao fato de que nesses métodos é possível estimar simultaneamente os efeitos dos marcadores ao invés de um único marcador, o que reduz a taxa de falsos positivos. A literatura ainda não apresenta nenhuma proposta sobre o método de RHM sob uma abordagem bayesiana e também sobre a estimação simultânea dos efeitos das regiões em um único modelo. Desta forma, no capítulo 1 desta dissertação é realizada uma revisão de literatura sobre as metodologias estatísticas utilizadas. O capítulo 2 visa comparar a eficiência de se estimar o efeito de todas as regiões genômicas simultaneamente através de um modelo bayesiano em relação ao procedimento de se estimar o efeito de cada região por vez através de dados simulados e depois para elucidar a utilização deste modelo nos programas de melhoramento, as estimações usando uma única região e todas as regiões simultaneamente também foram performadas em dados reais de arroz Oryza sativa. Esse estudo utilizou dados simulados através do pacote AlphaSimR e dados de arroz provenientes do Rice Diversity Project. O tamanho das regiões foi determinado como sendo a distância na qual o LD é metade do seu valor máximo e, para verificar se as regiões eram associadas as características fenotípicas, foi utilizada a Probabilidade a Posteriori da Associação da Janela (Window Posterior Probability of Association - WPPA). Para os dados simulados, a eficiência da estimação simultânea dos efeitos das regiões genômicas utilizando a estimação bayesiana, apresentou resultados superiores. Nos dados de arroz, a estimação simultânea detectou uma quantidade superior de regiões já relatadas na literatura em detrimento a estimação única, além de apresentar novas regiões genômicas que podem ser estudadas em analises pós-GWAS. Essa é uma metodologia que apresenta potencial para aplicação, descoberta e investigação de novas regiões genômicas associadas a características fenotípicas. Palavras-chave: Mapeamento de Herdabilidade Regional. Poder de detecção. Probabilidade a posterioriItem Autoencoder, análise via componentes principais e independentes aplicados no reconhecimento de padrões de populações(Universidade Federal de Viçosa, 2022-06-10) Costa, Jaquicele Aparecida da; Azevedo, Camila Ferreira; http://lattes.cnpq.br/6939298449989672Nos últimos tempos, diante do grande volume de informações, é essencial o desenvolvimento de metodologias que visam reduzir o tempo e esforço computacional da análise de dados com alta dimensionalidade. Nos estudos que buscam associações ou o reconhecimento de padrões, há um grande número de variáveis que apresentam informações sobrepostas ou correlacionadas, o que impossibilita a identificação de grupos divergentes, além de exigir um grande esforço computacional. A genética utiliza milhares de marcadores moleculares do tipo SNPs (Single nucleotide polymorphisms) para estimar os valores genéticos genômicos dos indivíduos, classificar genótipos dentro de determinados grupos e reconhecer padrões na população para direcionar os estudos de diversidade genética. Os principais métodos usados para redução de dimensionalidade são baseados em Análise via Componentes Principais (PCA), a versão esparsa da Análise via componentes Principais (SPCA) e Análise via Componentes Independentes (ICA). Outra técnica em destaque é a metodologia que combina os métodos PCA e ICA que é denominada Análise via Componentes Principais Independentes (IPCA), mas ainda pouco utilizada em banco de dados genômicos. Mais recentemente, têm se destacado os métodos fundamentados em inteligência artificial, como as redes neurais, sendo o Autoencoder um tipo de rede neural que também busca reduzir o espaço dimensional e reconstruir os dados com perda mínima de informação. Assim, o primeiro capítulo desta tese é uma revisão bibliográfica sobre os métodos estatísticos e baseados em inteligência computacional, destacando as vantagens e desvantagens ao utilizar cada uma das metodologias, além de apresentar as técnicas para agrupar e determinar o número ótimo de grupos nos estudos que visam reconhecer padrões. O segundo capítulo propõe a aplicação da PCA, SPCA e IPCA no reconhecimento de padrões de subpopulações do arroz asiático (Oryza Sativa) utilizando 36.901 marcadores moleculares e 413 genótipos, a fim de buscar uma técnica que seja eficiente e possa reduzir o tempo computacional na discriminação dos mesmos. As técnicas, PCA, SPCA e IPCA, apresentaram resultados similares, tais como a matriz confusão, porcentagem de acerto e correlação cofenética. O método Autoencoder foi menos eficiente, mas foi capaz de formar grupos mais compactos, menor variância dentro dos grupos, e mais dissimilares entre eles, maior variância entre os grupos, quando comparado com os métodos estatísticos tradicionais. Diante disso, foi proposto utilizar os componentes obtidos via PCA, SPCA e IPCA, como variáveis de entrada no Autoencoder. A proposta provocou melhorias no Autoencoder, sendo que o PCA-AUT (componentes principais como variáveis de entrada no Autoencoder) foi mais eficiente que os métodos estatísticos e o próprio Autoencoder, além de reduzir ainda mais o espaço dimensional para discriminar os genótipos de arroz. Além disso, a técnica conseguiu capturar parte da variabilidade mensurada antes de aplicar qualquer método de redução dimensional. Palavras-chave: Inteligência computacional. Redes Neurais. Redução de dimensionalidade. Oryza sativa. Marcadores Moleculares.Item Avaliação da concordância dos principais testes utilizados para comparação de curvas de sobrevivência por meio de simulações(Universidade Federal de Viçosa, 2016-02-24) Pereira, Geraldo Magela da Cruz; Emiliano, Paulo César; http://lattes.cnpq.br/3918050985377865O objetivo inicial deste estudo, foi aplicar métodos tradicionais em análise de sobrevivência para analisar a mortalidade de peixes (alevinos), quando submetidos a 5 dietas com diferentes fontes de lipídios. O estudo incluiu o uso de métodos paramétricos e não paramétricos. Pelo método Kaplan-Meier, foram obtidas estimativas de sobrevivência, e em seguida foram traçadas as curvas de sobrevivência para cada um dos tratamentos. O teste Logrank foi utilizado para comparar as curvas, com intuito de verificar a existência de diferenças significativas entre elas. Paralelamente, foi realizado estudo de simulação para avaliar a concordância dos principais testes utilizados para comparação de curvas de sobrevivência, além disso, avaliou-se também a concordância destes testes com o teste Tukey. Os dados foram simulados com base nos modelos paramétricos ajustados aos dados reais. Os resultados mostraram que a porcentagem de concordância entre os testes logrank, Wilcoxon (Gehan) e Tarone-Ware, foi próxima de 97% para diferentes cenários avaliados. A avaliação do teste Tukey resultou em uma baixa concordância, assim, o mesmo não deve ser utilizado para comparação dos efeitos de tratamentos, pois ele não leva em conta a presença de dados censurados.