Estatística Aplicada e Biometria

URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 10 de 11
  • Imagem de Miniatura
    Item
    Análise de estilo baseada em retornos: um estudo aplicado aos fundos de previdência complementar oferecidos pelo instituto Agros
    (Universidade Federal de Viçosa, 2021-11-04) Prates, Carlos Victor Bragatto; Barbosa, Eduardo Campana; http://lattes.cnpq.br/4525845624417719
    A introdução do Plano Real, em 1994, promoveu uma profunda mudança no cenário econômico nacional, bem como na postura do cidadão brasileiro, no que se refere a gestão do seu patrimônio pessoal e a escolha de estratégias e instrumentos financeiros, que permitam uma administração eficiente do mesmo. Nesse sentido, uma categoria de investimento que vem se destacando é a dos planos de previdência privada, uma importante alternativa para auxiliar o brasileiro no planejamento e no acúmulo de recursos para o futuro. Logo, o objetivo deste trabalho é aplicar a metodologia da Análise de Estilo Baseada em Retornos ou RBSA (do inglês, Return Based Style Analysis), para avaliar as estratégias de investimento ou de alocação de recursos e os retornos de dois planos previdenciários (B e CD) oferecidos pelo Agros, um Instituto da UFV de Seguridade Social, que oferece e administra planos de previdência privada e de saúde, com o intuito de suplementar os benefícios pagos pela previdência social aos servidores e ex-servidores da Universidade Federal de Viçosa (UFV). A referida metodologia utiliza um modelo de regressão linear múltipla, que através da imposição de algumas restrições paramétricas, busca estimar o percentual de alocação de um fundo a determinadas classes de ativos, descritas à priori nos documentos regulatórios do mesmo. Palavras-chave: Economia. Gestão. Investimentos. Restrições paramétricas. Regressão linear múltipla.
  • Imagem de Miniatura
    Item
    Análise de fatores aplicada em estudos de seleção genômica no melhoramento de Coffea canephora
    (Universidade Federal de Viçosa, 2020-02-20) Paixão, Pedro Thiago Medeiros; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/0114089076153492
    O Brasil se destaca em âmbito mundial na produção de café. Os incrementos observados em sua produtividade é resultado do aprimoramento de diversas metodologias. Dentre elas, destacam-se os métodos preditivos de valor genético. Estes contribuem significativamente na seleção de genótipos superiores, de forma a aumentar o ganho genético por unidade de tempo. Neste contexto, a seleção genômica ampla (GWS) é uma ferramenta que se destaca, uma vez que permite predizer o fenótipo futuro de um indivíduo baseado apenas em informações de marcadores moleculares. Realizar a seleção de maneira simultânea para várias características é o interesse da maioria dos programas de melhoramento, e a análise de fatores (AF) tem sido utilizada para auxiliar neste fim. A utilização de fatores se justifica devido a existência de correlações genéticas entre as características, as quais podem ser atribuídas aos QTL que têm efeitos pleiotrópicos ou aos QTL estreitamente ligados. Dessa forma, o objetivo deste trabalho foi de avaliar o uso da AF no contexto de GWS, em genótipos de Coffea canephora. Os resultados obtidos da seleção baseada nos fatores foram comparados, por meio da capacidade preditiva, acurácia e do coeficiente de Cohen’s Kappa, com aqueles advindos da análise das variáveis individuais. Para isso, foram utilizados dados fenotípicos e genotípicos de populações compostas por clones dos grupos varietais Conilon e Robusta e por híbridos originados de cruzamentos entre estes grupos, avaliados durante três anos consecutivos (2014 a 2016), e uma densidade de 18111 marcadores SNPs identificados. A partir dos resultados observados, verificou-se que a AF foi eficiente para elucidar as relações entre as características e originar novas variáveis. Os fatores formados são interessantes em termos de seleção, pois além de permitirem interpretações conjuntas, apresentam boas estimativas de capacidade preditiva, herdabilidade e acurácia. Ademais observou-se alta concordância entre os indivíduos selecionados com base nos fatores e aqueles selecionados considerando as variáveis individuais. Entretanto, cabe destacar que, a seleção baseada nos fatores conseguiu selecionar indivíduos de porte mais adequado. Palavras-chave: Predição Genômica. Análise Multivariada. Melhoramento Genético.
  • Imagem de Miniatura
    Item
    Comparação dos ajustes de modelos com erro normal e skew-normal
    (Universidade Federal de Viçosa, 2020-10-16) Nascimento, Jhennifer dos Santos; Emiliano, Paulo César; http://lattes.cnpq.br/3797894381138113
    Na modelagem de fenômenos aleatórios, em que uma variável aleatória quantitativa é estudada em função de uma variável aleatória qualitativa, é muito comum ser utilizada a análise de variâncias (ANOVA). Porém, para essa análise ser validada é necessário que quatro pressuposições sejam ve- rificadas com testes estatísticos, dentre elas, a normalidade do componente aleatório do modelo. Entretanto, na prática, alguns resultados de ensaios experimentais violam uma ou mais pressuposi- ções da ANOVA tornando-se necessária uma outra metodologia para analisar os dados. Com isso, o objetivo deste trabalho é, em vez de utilizar a metodologia anteriormente mencionada, fazer o ajuste de um delineamento inteiramente casualizado (DIC), atribuindo a distribuição skew-normal para o componente aleatório do modelo, utilizando o método da máxima verossimilhança. Neste estudo, foram utilizados dois conjuntos de dados não normais com indícios de dispersão assimetria que foram imprescindíveis para fazer comparação, através dos critérios de comparação AIC e BIC, entre a distribuição skew-normal e o seu submodelo normal. Para o primeiro conjunto de dados, referente a temperatura, foi ajustado um modelo de intercepto, e o segundo conjunto de dados refere-se a um experimento realizado segundo um DIC, que avaliou o percentual de gordura de idosos que praticaram diferentes intervenções de atividade física. Neste trabalho, conduziu-se todos os testes de comparação de contrastes de duas médias e intervalos de confiança para a distribuições normal e skew-normal. Além dos critérios de informação de Akaike e Bayesiano, para avaliar o ajuste dos modelos aos dados, foi realizada análise de resíduos quantílicos, e para finalizar, foram realizados estudos de simulação para avaliar inferência e as propriedades assintóticas dos estimado- res da distribuição skew-normal para os modelos ajustados. Conclui-se, assim, que esses estimadores ganham eficiência com o aumento do tamanho das amostras e fornecem melhores estimativas dos dados estudados em relação a distribuição normal, fato que foi comprovado no estudo dos envelopes simulados utilizando resíduos quantílicos e no estudo de simulação. Palavras-chave: Assimetria. Delineamentos experimentais. Monte Carlo. Verossimilhança.
  • Imagem de Miniatura
    Item
    Métodos aplicados aos estudos de associação genômica via regiões cromossômicas considerando efeitos aditivos e de dominância
    (Universidade Federal de Viçosa, 2021-03-01) Lima, Leísa Pires; Azevedo, Camila Ferreira; http://lattes.cnpq.br/1919088712911346
    Os avanços na biologia molecular e as inovações nas tecnologias de sequenciamento e de genotipagem permitiram o desenvolvimento de novos marcadores moleculares favorecendo os estudos de associação genômica ampla (Genome Wide Association Studies - GWAS). A análise via marcas únicas se destaca como o principal procedimento para estudar a associação entre marcas e QTL (Quantitative Trait Loci), porém metodologias que consideraram grupos de marcadores para flanquear regiões genômicas vem elucidando importantes resultados para estudos de associação. Várias abordagens estatísticas veem sendo propostas no âmbito da GWAS, no entanto, estudos comparativos revelam que os métodos bayesianos são superiores em termos do poder em detectar marcadores com associações significativas. Entre os critérios existentes de seleção de regiões se destacam, a seleção pela porcentagem da variância explicada por regiões genômicas (%var), o critério de seleção de tagSNPs (tagSNPs) e a seleção com base na probabilidade a posteriori da associação de regiões genômicas (WPPA - Window Posterior Probability of Association). Para também detectar regiões potencialmente associadas, foi proposto o critério baseado na probabilidade a posteriori do intervalo (Posterior Probability of Interval - 𝑃𝑃 𝑖𝑛𝑡 ) que visa selecionar regiões com base nos marcadores de maiores efeitos estimados via método bayesiano, neste estudo o BayesD𝜋. Além disso, uma metodologia alternativa, denominada mapeamento de herdabilidades regionais (Regional Heritability Mapping - RHM) vem apresentando importantes resultados. Dessa forma, o primeiro capítulo deste trabalho consiste em uma revisão de literatura sobre a GWAS apresentando sua definição e importância no melhoramento genético e abordando detalhes teóricos acerca dos critérios citados acima. Já o capítulo 2 visa propor a medida 𝑃𝑃 𝑖𝑛𝑡 e compará-la às demais abordagens, tagSNP, %var, WPPA conjuntamente ao BayesD𝜋 e metodologia de marcas únicas, quanto a eficiência em selecionar e identificar marcadores ou regiões associados a QTL. Para isso, utilizou-se dados simulados considerando seis cenários diferentes, sendo os SNPs alocados em regiões genômicas não sobrepostas. Os resultados do segundo capítulo indicaram que para características com herança oligogênica, o critério WPPA seguido dos critérios %var e 𝑃𝑃 𝑖𝑛𝑡 se mostraram superiores, apresentando maiores valores de poder de detecção, capturando maiores porcentagens de variância genética e maiores áreas. Para características com herança poligênica, os critérios 𝑃𝑃 𝑖𝑛𝑡 e WPPA foram considerados superiores aos demais. Ademais, o capítulo 3 avalia os critérios, 𝑃𝑃 𝑖𝑛𝑡 e WPPA, que se mostraram superiores no capítulo 2 junto aos métodos de análise via marcas únicas e o RHM. No entanto, a eficiência em termos de poder de detecção e de falsos positivos destes métodos foi avaliada considerando ou não a inclusão dos efeitos de dominância nos modelos estatísticos. Para isso, foram utilizados dados simulados em dezoito cenários com diferentes níveis de herdabilidade, arquitetura genética e grau médio de dominância. Os resultados indicaram que para os efeitos aditivos considerando características com arquitetura genética oligogênica, os critérios WPPA, RHM e 𝑃𝑃 𝑖𝑛𝑡 se mostraram superiores para todos os graus de dominância analisados. Já para características com herança poligênica, os critérios 𝑃𝑃 𝑖𝑛𝑡 e WPPA podem ser considerados superiores aos demais. Considerando apenas os efeitos devido à dominância, os critérios WPPA, RHM, análise via marcas únicas e 𝑃𝑃 𝑖𝑛𝑡 apresentaram resultados relevantes com relação as medidas de eficiência para as características controladas por 3 QTL. Palavras-chave: Regiões Genômicas. Marcadores Moleculares. Métodos Bayesianos. Variância Genética.
  • Imagem de Miniatura
    Item
    Curva ROC para comparação de modelos de predição para variáveis dicotômicas
    (Universidade Federal de Viçosa, 2020-02-28) Silva Neto, Zeferino Gomes da; Martins Filho, Sebastião; http://lattes.cnpq.br/5738630579322084
    A utilização de modelos de regressão logística e de seleção genômica ampla (GWS) tem elevada importância em ciências agrárias e, portanto, há necessidade de aplicação de metodologias eficientes para a avaliação do poder discriminatório destes modelos. Uma metodologia pouco difundida nesta área e em GWS é a Receiver Operating Characteristic, ou curva ROC. Neste trabalho, objetivou-se aplicar curva ROC para a seleção de modelos de regressão logística aplicados a dados de germinação de sementes de pimentas habanero e à GWS, considerando dados de resistência do arroz Oriza sativa à brusone. Os modelos testados para a predição da capacidade germinativa das sementes foram compostos dos fatores: variedade (laranja e vermelha), período de armazenamento do fruto (0, 7 e 14 dias), método de extração das sementes (manual e mecânico) e período de armazenamento das sementes (3, 6, 9 e 12 meses). O modelo que se mostrou mais adequado conteve a interação entre variedade, armazenamento do fruto e armazenamento da semente. Por sua vez, os métodos utilizados na GWS, para avaliação da resistência à brusone, foram o BRR (Bayesian Ridge Regression), Bayes C𝜋 e BLASSO. Esses métodos foram comparados pelos seguintes critérios: taxa de erro na validação, coeficiente de Spearman e viés com a área abaixo da curva ROC (AUC). Os valores de AUC para a seleção dos modelos mostraram-se equivalentes aos valores dos índices usuais, que indicaram os modelos BRR e Bayes C𝜋 como os melhores. Além disso, a representação gráfica das curvas ROC se mostrou ainda mais vantajosa por permitir a determinação da sensibilidade dos modelos em diferentes valores de especificidade. Abaixo de 0,25 de 1-especificidade os modelos BRR e Bayes C𝜋 foram mais sensíveis que o BLASSO, mas acima deste valor todos foram equivalentes. No entanto, o BRR apresentou menor tempo de execução (4h52min, 6h1min, 6h25min para o BRR, Bayes C𝜋 e BLASSO, respectivamente). Por fim, pode-se verificar que a análise ROC se mostrou eficiente para a avaliação de modelos de regressão logística e de GWS e, portanto, os resultados aqui apresentados indicam que a curva ROC pode ser utilizada como uma excelente ferramenta para seleção de modelos em ciências agrárias. Palavras-chave: Regressão logística. Seleção Genômica Ampla. Germinação de sementes. Brusone do arroz. Pimenta habanero. Qualidade de ajuste de modelo.
  • Imagem de Miniatura
    Item
    Análises uni e multivariada para avaliação em cruzamentos dialélicos parciais
    (Universidade Federal de Viçosa, 2020-02-18) Oliveira, Ana Carolina Ribeiro de; Cecon, Paulo Roberto; http://lattes.cnpq.br/0231423029429573
    A espécie Capsicum annuum L. ocupa uma posição representativa no mercado brasileiro de hortaliças. Assim, com o intuito de atender às exigências do mercado, faz-se necessário o desenvolvimento de novas cultivares, e isso dependerá, da variabilidade genética presente na população em estudo. Neste sentido, o estudo da diversidade genética entre os indivíduos por meio da adoção de técnicas multivariadas, tais como: a análise de agrupamentos e os mapas auto-organizáveis de Kohonen, tornam-se importantes, sobretudo, para seleção de genitores adequados à obtenção de híbridos, com maior efeito heterótico e que proporcionem maior segregação em recombinações, possibilitando o aparecimento de transgressivos. Ademais, o uso de cruzamentos dialélicos propiciam estimativas de parâmetros úteis na seleção de genitores para hibridação e entendimento da ação gênica envolvida na determinação dos caracteres de interesse. As metodologias de Griffing (1956) e Gardner e Eberhart (1966) fornecem informações sobre a capacidade combinatória (geral e específica) e a heterose, respectivamente. Deste modo, objetivou-se avaliar o desempenho de nove genótipos de C. annuum e seus 20 híbridos, obtidos via cruzamentos dialélicos parciais, por meio de caracteres do fruto. O experimento I foi conduzido em casa de vegetação sob delineamento inteiramente casualizado, com quatro repetições. Foram avaliados nove genótipos de Capsicum annuum L., sendo eles: Pimenta Vulcão, Pimenta Cayene, Pimenta Peter, Pimenta Picante para vaso, Pimenta Jamaica Yellow, Pimenta Doce Italiana, Pimentão Quadrado, Pimentão Cascadura Ikeda e Pimentão Rubi Gigante. Os caracteres avaliados foram: peso total do fruto (PTF, g), comprimento do fruto (CF, mm), largura do fruto (LF, mm), espessura do pericarpo (ESP, mm), número de sementes por fruto (NSF), massa da matéria total do fruto fresca (MTF, g) e porcentagem da massa da matéria total do fruto seca (%MTS, g). Os dados obtidos foram submetidos à análise de variância e as médias comparadas pelo critério de Scott-Knott (p < 0,05), para a separação de médias de tratamentos em grupos distintos, por meio da minimização da variação dentro e maximização da variação entre grupos. Para o estudo da diversidade genética, foi adotado a distância de Mahanalobis; os métodos de agrupamento da ligação média entre grupos (UPGMA) e Tocher; e os mapas auto-organizáveis de Kohonen. Observou-se a existência de variabilidade genética entre os genótipos de Capsicum annuum L.; e a formação de dois e quatros grupos, pelos métodos UPGMA e Tocher, respectivamente. A organização da similaridade, estabelecida pelo mapa auto-organizável de Kohonen, apresentou grande potencial no processo de direcionamento de genitores para formação dos dialelos, ao realçar as separações dos grupos de genótipos. O experimento II foi conduzido em casa de vegetação sob delineamento inteiramente casualizado, com quatro repetições. Foram avaliados nove genótipos de Capsicum annuum L. e suas combinações híbridas, por meio de um dialelo parcial (5x4). Pela metodologia de Griffing, adaptada por Geraldi e Miranda Filho (1988), verifica-se que os genótipos ‘Pimentão Quadrado’, ‘Pimenta Jamaica Yellow’, ‘Pimenta Picante para vaso’, ‘Pimenta Cayene’ e ‘Pimenta Peter’ apresentaram os maiores valores de capacidade geral de combinação (CGC), o que os torna potenciais pais em programas de melhoramento de novos híbridos. Os híbridos ‘Pimenta Cayene x Pimentão Cascadura Ikeda’, ‘Pimenta Jamaica Yellow x Pimentão Cascadura Ikeda’ e ‘Pimenta Picante para vaso x Pimentão Quadrado’ destacaram- se pelo melhor desempenho, com as melhores capacidades específicas de combinação e com pelo menos um dos pais com alta CGC, para os caracteres CF, LF e NSF, e %MTS, respectivamente. Adotando-se a metodologia de Gardner e Eberhart, adaptada por Miranda Filho e Geraldi (1984), observa-se que os genótipos ‘Pimentão Quadrado’ e ‘Pimenta Picante para vaso’ apresentaram maior potencial per se, considerando todos os caracteres, e entre os efeitos de heterose específica os cruzamentos ‘Pimenta Vulcão x Pimentão Quadrado’ e ‘Pimenta Cayene x Pimentão Quadrado’ têm efeitos positivos para 77% dos caracteres avaliados. Por fim, foram realizados o ajuste de modelos de regressão não linear para descrever o crescimento de pimentas (Capsicum annuum L.) ao longo do tempo, por meio do método dos mínimos quadrados ordinários (MQO); a identificação do modelo com melhor ajuste e a comparação do modelo obtido por MQO com o modelo via regressão quantílica não linear (RQ), nos quantis 0,25, 0,5 e 0,75. Como resultados, os modelos de regressão não linear Logístico e von Bertalanffy foram indicados para descrever o crescimento de pimentas. A RQ foi eficiente para ajustar modelos de crescimento, quando comparada à regressão não linear obtida por mínimos quadrados ordinários. Palavras-chave: Capsicum annuum L. Regressão quantílica. Modelos não lineares. Mapa de Kohonen. Diversidade genética.
  • Imagem de Miniatura
    Item
    Métodos de concordância ou coincidência entre modelos: simulação e aplicação a dados de crescimento de planta de alho
    (Universidade Federal de Viçosa, 2020-02-18) Moura, George Lucas Santana de; Cecon, Paulo Roberto; http://lattes.cnpq.br/0657704531110710
    O objetivo deste trabalho foi realizar um estudo de simulação de vários métodos de concordância ou coincidência entre modelos, e utilizar-se destes métodos como critério para comparação de modelos de regressão não linear aplicados ao acúmulo de massa seca total da planta de alho em função do tempo. O critério de Akaike, critério de identidade de modelos e Erro Quadrático Médio são alguns critérios utilizados para comparação entre varios modelos de regressão, este trabalho propõe utilizar-se de índices como de Willmott, Nash-Sutcliffe e para verificar o grau de concordância entre os modelos de regressão não linear Logístico e Gompertz. Os 89 acessos de alho são oriundos do Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa(BGH/UFV), foi escolhido convenientemente apenas o acesso de alho que mais se adequa aos modelos citados, foram utilizados apenas estes dois modelos sigmoidais porque os critérios de concordância apresentados aqui são utilizados dois a dois. O estudo de simulação revelou que nenhum índice sozinho pode substituir os demais. No acesso de alho escolhido, todos os índices apresentaram valores concordantes. Palavras-Chave: Análise de Regressão, Modelos de crescimento, Análise por simulação.
  • Imagem de Miniatura
    Item
    Síndrome da fadiga crônica e absenteísmo: estudo de trabalhadores em turnos comparando stepwise e elastic-net
    (Universidade Federal de Viçosa, 2020-02-28) Neisse, Anderson Cristiano; Oliveira, Fernando Luiz Pereira de; http://lattes.cnpq.br/5364139874668396
    Caracterizada por fadiga persistente, dor muscular, dificuldades cognitivas e de sono, a Sídrome da Fadiga Crônica (CFS) tem se tornado comum nas práticas clínicas nas últimas décadas desde sua recente definição, em 1988. Estudos resultantes da contínua busca por fatores relacionados à CFS citam, dentre outros: sono irregular/insatisfatório, estresse psicológico, disfunção hormonal, deficiência de nutrientes, disfunção imunológica e infecções. Em condições de trabalho de risco o desenvolvimento da CFS pode aumentar a chance de acidentes fatais, tal como o trabalho em turnos na área de mineração que naturalmente já possui fatores evidentemente relacionados à CFS. Estudos indicam que indivíduos com má qualidade de sono e ciclos circadianos irregulares têm risco elevado de CFS, neuroticismo e absenteísmo. Uma vez que modelagem preditiva pode se mostrar efetiva tanto na pre- venção da fadiga quanto na detecção de fatores, este estudo tem o objetivo de utilizar de regressão logística ajustada por meio de dois métodos de seleção/regularização (Stepwise e Elastic-Net) para procurar modelo que descreva a relação entre variáveis bioquímicas e antropométricas com o absenteísmo. Desta forma, por meio do absenteísmo e utilizando de efeitos encontrados na bibliografia, o objetivo é procurar evidência de relação entre a CFS e absenteísmo. Os resultados obtidos mostram indícios de relação do colesterol total, HDL, LDL e Triglicerídeos com o risco de absenteísmo, relação também presente para as variáveis de sódio e potássio. Com exceção ao potássio, todas as variáveis também possuem relação similar com a CFS, de acordo com a literatura. PALAVRAS-CHAVE: Síndrome da Fadiga Crônica. Biometria. Regressão Logística. Elastic-Net.
  • Imagem de Miniatura
    Item
    Comparação de métodos de classificação em dados de espectroscopia NIR
    (Universidade Federal de Viçosa, 2020-06-25) Dias, Cristina Silva; Peternelli, Luiz Alexandre; http://lattes.cnpq.br/4392053404888343
    A crescente demanda de biomassa para produção de energia e etanol de segunda geração tem impulsionado a seleção de cultivares de cana-de-açúcar com maiores teores de fibra e sacarose aparente. Nesse sentido, torna-se importante buscar métodos de classificação aliados a técnica de espectroscopia do infravermelho próximo (NIR) para facilitar a seleção desses indivíduos. O objetivo desse trabalho é comparar os métodos de classificação: Análise Discriminante por Quadrados Mínimos Parciais (PLS-DA), Máquinas de Vetores de Suporte (SVM) e Florestas Aleatórias (RF) para verificar qual deles apresenta um melhor desempenho para a classificação dessas propriedades a partir de dados de espectroscopia NIR. Foi utilizado um conjunto de dados NIR composto por 460 amostras para classificação de fibra (FIB) e sacarose aparente (PC). A análise foi realizada em duas etapas. Na primeira etapa o conjunto de dados foi separado em conjunto treino e conjunto teste via algoritmo Kernard-Stone para a escolha dos pré-tratamentos. Na segunda etapa foi utilizado o pré-tratamento selecionado para cada método, separando novamente o conjunto original (460 amostras) em conjunto de treino e conjunto de teste, de forma aleatória com 10 repetições. Após todos os procedimentos, os resultados obtidos na comparação dos métodos mostraram que o PLS-DA e o SVM não apresentam diferença significativa (p ≥ 0,05) e ambos diferiram do RF para a classificação das propriedades %PC e %FIB (p < 0,05). Foram avaliados os parâmetros de erro de classificação, sensibilidade e especificidade. Para todos esses parâmetros o PLS-DA e o SVM foram mais satisfatórios que o RF, pois apresentaram menores valores de erro de classificação e maiores valores para sensibilidade e especificidade podendo, assim, serem considerados métodos eficazes para classificação do dado de espectroscopia NIR utilizados nesse trabalho. Palavras-chave: Cana-de-açúcar. Máquinas de Vetor Suporte. Floresta Aleatória. Análise Discriminante por Quadrados Mínimos Parciais. Infravermelho Próximo.
  • Imagem de Miniatura
    Item
    Análise de variáveis canônicas no software R
    (Universidade Federal de Viçosa, 2020-10-26) Barbosa, Wagner Faria; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/7238720100539414
    As variáveis canônicas (𝑉𝐶𝑠) são combinações lineares de variáveis quantitativas utilizadas na discriminação de grupos. No contexto de experimentos executados com tratamentos repetidos sob diferentes delineamentos de casualização, a obtenção das 𝑉𝐶𝑠 pressupõe a realização da MANOVA, uma vez que elas são obtidas pela maximização da relação entre a variação entre e dentro dos tratamentos utilizando, respectivamente, as matrizes de soma de quadrados e produtos do tratamento (𝑯) e do resíduo (𝑬). Funções discriminantes lineares de Fisher (𝐹𝐷𝑠), por outro lado, são combinações lineares de variáveis cujo principal objetivo é a classificação de observações em populações distintamente estabelecidas e conhecidas a priori. Uma vez que existe uma equivalência matemática para obtenção das 𝐹𝐷𝑠 e das 𝑉𝐶𝑠, a obtenção das 𝑉𝐶𝑠 pode ser facilitada pela obtenção de 𝐹𝐷𝑠, que é um método mais comumente encontrado em softwares estatísticos. Neste sentido, o objetivo deste trabalho foi de analisar, por meio da simulação de dados, a equivalência entre as 𝐹𝐷𝑠 e as 𝑉𝐶𝑠, a partir de experimentos instalados sob o DIC, DBC e DQL. A obtenção das 𝑉𝐶𝑠 por meio das 𝐹𝐷𝑠 foi realizada utilizando a função 𝑙𝑑𝑎 implementada no software R com o uso dos valores transformados das observações de cada variável-resposta pela subtração dos efeitos perturbadores (ou seja, de bloco para o DBC, ou de linha e coluna para o DQL) quando eles existiam no modelo estatístico. Além disso, duas padronizações foram utilizadas na obtenção das 𝑉𝐶𝑠. Os resultados proporcionados por ambos os métodos foram comparados por diferentes medidas que incluíram, autovetores, autovalores, importância relativa, além de correlações e da análise de variância e inspeção visual de gráficos bidimensionais, e comprovaram a similaridade das 𝑉𝐶𝑠 com as 𝐹𝐷𝑠, uma vez que não houve prejuízo nem na interpretabilidade nem nas análises realizadas com ambas as funções lineares. Conclui- se, portanto, que as 𝑉𝐶𝑠 podem ser eficientemente obtidas por meio das 𝐹𝐷𝑠 com o uso da função 𝑙𝑑𝑎 e ambos os métodos são equivalentes. Palavras-chave: Análise multivariada. Delineamentos experimentais. Análise discriminante.