Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
5 resultados
Resultados da Pesquisa
Item Testes F e de normalidade avaliados sob diferentes condições experimentais(Universidade Federal de Viçosa, 2023-02-17) Ribeiro Neto, Homero; Santos, Nerilson Terra; http://lattes.cnpq.br/1186796802413495A pressuposição de normalidade dos erros experimentais é uma das exigências que se impõe para a aplicação de importantes procedimentos inferenciais, como o teste F da Análise de Variância (ANOVA), muito empregada em diversos campos científicos, como as Ciências Agrárias. Nesse sentido, resultados importantes e conhecidos da Estatística, como o Teorema Central do Limite, não impõem, teoricamente, muitas dificuldades para se obter, a partir de praticamente qualquer variável aleatória não normal, uma nova variável aleatória, que seja normal, com a finalidade de não violar essa pressuposição. No entanto, por questões de ordem prática, nem sempre é possível obter um número de repetições por tratamento suficientemente elevado para que o Teorema supracitado seja aplicado. Assim, algumas das alternativas mais empregadas são os testes de normalidade, para, com quantidades limitadas de observações amostrais, inferir a respeito da normalidade dos dados. Porém, as efetividades desses testes, assim como de outros testes de hipóteses, em termos de poder (probabilidade de rejeitar uma hipótese nula falsa) e nível de significância (probabilidade de rejeitar uma hipótese nula verdadeira cometendo o erro tipo I), são influenciadas pelas condições experimentais. Por isso, este trabalho foi realizado com o objetivo de comparar o desempenho dos testes de normalidade mais comuns em condições de igualdade (desigualdade) das médias dos tratamentos, homogeneidade (heterogeneidade) de suas variâncias residuais, número de repetições de cada um e simetria (assimetria) das distribuições de probabilidades dos erros experimentais. Foi possível também analisar o desempenho do próprio teste F, inclusive quando a pressuposição de normalidade foi violada. De maneira geral, foi possível concluir, ao realizar simulações, que o poder empírico dos testes de normalidade tende a cair quando a distribuição empírica dos erros experimentais é simétrica e o número total de observações é muito baixo, e que as taxas de erro tipo I, tanto dos testes de normalidade, quanto do teste F, tendem a aumentar quando as variâncias residuais dos tratamentos são heterogêneas. Palavras-chave: Testes de Hipóteses. Nível de Significância. Erro Tipo I. Erro tipo II. Análise de Variância (ANOVA). Delineamento Inteiramente Casualizado (DIC). Distribuição Normal. Erros Experimentais.Item Metodologia Gage R&R: uma abordagem de estimação intervalar via método delta multivariado(Universidade Federal de Viçosa, 2022-05-25) Teixeira, Camila Cristina; Barbosa, Eduardo Campana; http://lattes.cnpq.br/2578067704033833A qualidade dos mais variados processos de produção está diretamente associada à análise estatística de dados coletados dos mesmos. Portanto, para tentar minimizar a probabilidade de fracassos ou de falhas, métodos estatísticos são utilizados. Um dos estudos mais tradicionais para avaliar um sistema de medição é denominado como Gage R&R (MSA, 2010; MONTGOMERY; RUNGER, 1993), em que a variação total do sistema é decomposta em, principalmente, duas partes: Repetibilidade e Reprodutibilidade. Logo, o objetivo deste trabalho é realizar o estudo de Gage R&R, via método da Análise de Variância (ANOVA), para estimar os quadrados médios associados aos fatores aleatórios operador e peça, e, em seguida, através do Método dos Momentos, obter os estimadores para as componentes de variância associadas a Repetibilidade e a Reprodutibilidade. Posteriormente, estima-se o índice R&R (%) e obtêm-se um intervalo de confiança assintótico, que permite classificar o sistema de medição quanto a sua adequação, de acordo com um quadro de referência utilizado por acadêmicos e profissionais atuantes nas indústrias. Palavras-chave: Intervalo de Confiança. Operador. Peça. Qualidade. Repetibilidade. ReprodutibilidadeItem Desempenho de testes de homogeneidade de variâncias em diferentes cenários simulados(Universidade Federal de Viçosa, 2021-06-30) Menezes, Gleynner Ghiotto Lima; Santos, Nerilson Terra; http://lattes.cnpq.br/4019897827963986A confiabilidade nos resultados obtidos a partir dos testes de hipóteses estão sujeitos ao atendimento de pressuposições, o qual, quando pelo menos uma delas não é satisfeita, seu desempenho ou nível de confiança pode estar comprometido, levando a conclusões errôneas. Deste modo, existem diversos testes na literatura que foram propostos a fim de verificar a suposição de homogeneidade de variâncias em análises estatísticas, sendo esta tomada por diversos autores como o fator de maior influência sobre a sensibilidade dos resultados. No entanto, não existe um consenso sobre o melhor cenário de aplicação para cada um deles. Neste trabalho, pretende-se comparar os testes de homogeneidade de variâncias paramétricos de Bartlett, Levene, Brown- Forsythe, Cochran e Hartley, e os testes não paramétricos de Fligner- Killeen, Conover e Mood, através de um estudo de simulação utilizando o software R, onde, serão realizadas comparações segundo um Delineamento Inteiramente Casualisado sobre os seguintes aspectos de avaliação: proporção de heterogeneidade, proporção de desbalanceamento e diferentes distribuições de probabilidades. A hipótese de homocedasticidade foi adotada para analisar a taxa empírica do erro tipo I (𝛼̂) e, a de heterocedasticidade, para analisar a taxa empírica do poder do teste (𝜋̂). Diante disso, foi observado que, sob distribuição normal, o teste paramétrico de Bartlett obtém o melhor controle da taxa empírica do erro tipo I e obtém alto poder nos cenários balanceados e desbalanceados. Quando os conjuntos de dados são provenientes de populações não normais, o teste paramétrico de Brown- Forsythe foi o mais indicado. Dentre os testes não paramétricos, o teste de Mood foi o mais indicado para atuar sobre as três distribuições de probabilidades avaliadas. Palavras-chave: Heterocedasticidade. Robustez. Poder.Item Análise de variáveis canônicas no software R(Universidade Federal de Viçosa, 2020-10-26) Barbosa, Wagner Faria; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/7238720100539414As variáveis canônicas (𝑉𝐶𝑠) são combinações lineares de variáveis quantitativas utilizadas na discriminação de grupos. No contexto de experimentos executados com tratamentos repetidos sob diferentes delineamentos de casualização, a obtenção das 𝑉𝐶𝑠 pressupõe a realização da MANOVA, uma vez que elas são obtidas pela maximização da relação entre a variação entre e dentro dos tratamentos utilizando, respectivamente, as matrizes de soma de quadrados e produtos do tratamento (𝑯) e do resíduo (𝑬). Funções discriminantes lineares de Fisher (𝐹𝐷𝑠), por outro lado, são combinações lineares de variáveis cujo principal objetivo é a classificação de observações em populações distintamente estabelecidas e conhecidas a priori. Uma vez que existe uma equivalência matemática para obtenção das 𝐹𝐷𝑠 e das 𝑉𝐶𝑠, a obtenção das 𝑉𝐶𝑠 pode ser facilitada pela obtenção de 𝐹𝐷𝑠, que é um método mais comumente encontrado em softwares estatísticos. Neste sentido, o objetivo deste trabalho foi de analisar, por meio da simulação de dados, a equivalência entre as 𝐹𝐷𝑠 e as 𝑉𝐶𝑠, a partir de experimentos instalados sob o DIC, DBC e DQL. A obtenção das 𝑉𝐶𝑠 por meio das 𝐹𝐷𝑠 foi realizada utilizando a função 𝑙𝑑𝑎 implementada no software R com o uso dos valores transformados das observações de cada variável-resposta pela subtração dos efeitos perturbadores (ou seja, de bloco para o DBC, ou de linha e coluna para o DQL) quando eles existiam no modelo estatístico. Além disso, duas padronizações foram utilizadas na obtenção das 𝑉𝐶𝑠. Os resultados proporcionados por ambos os métodos foram comparados por diferentes medidas que incluíram, autovetores, autovalores, importância relativa, além de correlações e da análise de variância e inspeção visual de gráficos bidimensionais, e comprovaram a similaridade das 𝑉𝐶𝑠 com as 𝐹𝐷𝑠, uma vez que não houve prejuízo nem na interpretabilidade nem nas análises realizadas com ambas as funções lineares. Conclui- se, portanto, que as 𝑉𝐶𝑠 podem ser eficientemente obtidas por meio das 𝐹𝐷𝑠 com o uso da função 𝑙𝑑𝑎 e ambos os métodos são equivalentes. Palavras-chave: Análise multivariada. Delineamentos experimentais. Análise discriminante.Item Análise de fatores aplicada na seleção genômica em suínos(Universidade Federal de Viçosa, 2015-02-26) Teixeira, Filipe Ribeiro Formiga; Nascimento, Moysés; http://lattes.cnpq.br/4574646837472160A seleção genômica, ou seleção genômica ampla foi proposta com a finalidade de otimizar o processo de melhoramento genético utilizando simultaneamente dados fenotípicos e genotípicos por meio de marcadores SNP’s, presentes em todo o genoma. Várias metodologias têm sido implementadas, principalmente utilizando regressão linear e considerando os efeitos dos marcadores fixos (BLUP, LS, etc.) ou considerando os efeitos aleatórios (Bayes A, Bayes B, LASSO Bayesiano, dentre outras). Em geral, tais metodologias analisam cada característica individualmente, ou seja, os resultados obtidos são válidos apenas para uma única variável. Entretanto, em programas de melhoramento o interesse recai em ganhos para mais de uma característica conjuntamente. Dessa forma, desenvolver uma abordagem que trabalhe com análises que considerem várias características simultaneamente pode ser interessante, visto que poderíamos estudar um conjunto de caracteres importantes conjuntamente. Uma metodologia possível de ser utilizada para este fim é a análise fatorial (ou análise de fatores - AF). Tal metodologia permite a obtenção de variáveis latentes (fatores comuns) que representam um conjunto das variáveis originais. A partir de então, análises posteriores podem ser realizadas utilizando as variáveis latentes criadas. Diante do exposto, o principal objetivo deste trabalho foi propor a utilização da análise de fatores para criação de variáveis latentes altamente associadas às variáveis fenotípicas originais, de modo que possamos estimar o mérito genético para os indivíduos considerando várias variáveis simultaneamente. Objetivou-se também comparar os resultados obtidos com aqueles advindos das análises individuais. Para tanto, foram utilizados dados fenotípicos e genotípicos provenientes de 345 suínos obtidos pelo cruzamento das raças Piau e Comercial, oriundos da Granja de Melhoramento de Suínos do Departamento de Zootecnia da Universidade Federal de Viçosa (UFV), no período de novembro de 1998 a julho de 2001, utilizando 237 marcadores SNP’s e 41 variáveis fenotípicas. No primeiro capítulo foi aplicada a análise de fatores para verificar a estrutura de associação entre as variáveis e averiguar a que fator cada variável pertence, onde são identificados os fatores interpretáveis. No segundo capítulo, técnicas bayesianas de seleção genômica ampla foram aplicadas nas variáveis latentes interpretáveis para predição do mérito genético e seleção dos indivíduos, comparando assim os resultados com o que foi encontrado para as variáveis fenotípicas individualmente. Os resultados obtidos indicam que a aplicação da análise de fatores para obtenção de variáveis latentes que representam um conjunto de caracteres para posterior uso em seleção genômica ampla se mostrou eficiente, visto que apresentou valores de acurácia semelhantes aos encontrados considerando as análises individuais das variáveis e alta concordância entre os indivíduos selecionados considerando a variável latente e as variáveis individuais.