Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
39 resultados
Resultados da Pesquisa
Item PGV equitativa – planta genérica de valores com princípios de equidade imobiliária utilizando geoestatística e aprendizagem de máquina(Universidade Federal de Viçosa, 2023-07-07) Torres Filho, Hudson Costa; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/0567790591976852Muitos municípios brasileiros tiveram seu crescimento econômico acentuado nos últimos anos, promovendo, consequentemente, transações imobiliárias sem padronização, com alta especulação e praticamente sem qualquer fonte de informações de equilíbrio tributário. Por outro lado, apesar dos cadastros imobiliários estarem em funcionamento, suas informações e de mercado estão muitas vezes desatualizadas e/ou com insuficiência para a formulação de qualquer modelo estatístico que garanta a confiabilidade da determinação dos valores. Os municípios de pequeno porte (até 30 mil habitantes), em sua grande maioria, enfrentam grandes dificuldades também no processo de avaliação em massa de imóveis, principalmente na atualização da Planta Genérica de Valores - PGV, importante instrumento do Código Tributário Municipal - CTM. Entre outros problemas, esses municípios apresentam pouca infraestrutura para utilização de métodos estatísticos padronizados e aplicação dos mesmos. Assim, a solução mais eficiente seria a utilização de um conjunto metodológico cuja aplicação do princípio da equidade imobiliária evidenciasse a busca pela justiça tributária na arrecadação de tributos municipais, mais especificamente o Imposto Predial Urbano (IPTU). Dessa forma, a partir de um cadastro imobiliário urbano completamente atualizado, objetiva-se propor a criação de uma PGV com princípios científicos de equidade imobiliária. Para tanto, a NBR 14.653 de 2019 foi adotada, além da Geoestatística, Aprendizagem de Máquina e Geoprocessamento. Palavras-Chave: Planta de valores, IPTU, Cadastro imobiliário, Avaliação em Massa.Item Análise de componentes principais e análise de fatores em acessos de Capsicum annuum L. no estudo de variabilidade genética(Universidade Federal de Viçosa, 2023-08-30) Santos, Raquel Cordeiro; Cecon, Paulo Roberto; http://lattes.cnpq.br/8324411827990437As pimenteiras pertencem a família Solanácea e ao gênero Capsicum, a qual representa grande variabilidade de plantas. As pimentas são consumidas em todo o mundo e em razão de seus diversos usos e demanda de mercado é necessário buscar opções de maior qualidade e produtividade, o que pode ser feito pela escolha de genótipos superiores. O objetivo dessa pesquisa foi estudar a variabilidade genética de acessos de pimenta (C. annuum) por meio de técnicas de análise de componentes principais e análise de fatores. Utilizando o delineamento experimental inteiramente casualizado, com quatro repetições foram analisados nove acessos de Capsicum annuum L., são eles: Pimenta Vulcão, Pimenta Cayene, Pimenta Peter, Pimenta Picante para vaso, Pimenta Jamaica Yellow, Pimenta Doce Italiana, Pimentão Quadrado, Pimentão Cascadura Ikeda e Pimentão Rubi Gigante. As características avaliadas foram: peso total do fruto (PT, g), comprimento do fruto (COM, mm), largura do fruto (LAR, mm), espessura do pericarpo (ESP, mm), número de sementes por fruto (NS), massa da matéria total do fruto fresca (MF, g), Massa da matéria total do fruto maduro seco (MS, g), Teor de sólidos solúveis (BRIX), Teor de Vitamina C (VIT, mg100g −1 ). Foi aplicada a técnica de análise multivariada denominada de componentes principais (ACP), que permitiu reduzir a dimensão da amostra, pela qual foram retidos dois componentes que juntos explicaram mais de 90% da variabilidade contida nos dados. A análise de divergência genética entre os acessos foi realizada por meio da técnica de análise multivariada denominada de análise de fatores (AF), seguido da rotação Varimax, levando a identificação de três grupos geneticamente divergentes o que permite abordagens mais direcionadas para otimizar as características-chave relacionadas ao mercado de pimentas. Palavras-chave: Análise multivariada. Variabilidade genética. Pimenta.Item Estudo de divergência genética em acessos de Capsicum annuum L., utilizando métodos de agrupamento(Universidade Federal de Viçosa, 2022-02-21) Souza Neto, Thaynara Aparecida de; Cecon, Paulo Roberto; http://lattes.cnpq.br/9038682869781380A Capsicum annuum L. é a espécie mais cultivada e economicamente importante do gênero e, por tal motivo, estudos em divergência genética são importantes, pois permitem conhecer o grau de seleção da variabilidade genética das populações vegetais e identificar combinações híbridas. Sendo assim, o objetivo foi avaliar a diversidade genética de genótipos de C. annuum L., por meio de técnicas multivariadas de agrupamentos, utilizando os métodos hierárquicos, Vizinho mais próximo e Ward e não-hierárquicos, 𝑘-médias e Tocher. Os dados foram provenientes de um experimento conduzido na área experimental na casa de vegetação do Departamento de Agronomia da Universidade Federal de Viçosa, sob delineamento inteiramente casualizado, com quatro repetições e uma planta como unidade experimental. Vinte e nove genótipos de C. annuum registrados no Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH/UFV) foram avaliados com base em 6 características, dentre elas, Comprimento e largura do fruto maduro, Peso total dos frutos por planta, Espessura da polpa, Teor de vitamina C e Número de sementes por fruto. Os nove genótipos foram divididos em 2, 5 e 2 grupos pelos métodos hierárquicos, de Tocher e 𝑘 −médias, respectivamente. Para os cruzamentos, o método do Vizinho mais próximo reuniu 95% dos genótipos no grupo 𝐼𝐼 e para o método de Ward, os grupos possuíram uma porcentagem bem próxima, no qual o grupo 𝐼𝑉 reuniu o maior número de genótipos (45%). Os métodos de Tocher e 𝑘 −médias foram divididos em 5 e 3 grupos, respectivamente. Para todos os dados, o método do Vizinho mais próximo reuniu 86,20% dos genótipos no grupo 𝑉 e o de Ward, 44,83% no grupo 𝑉, contendo este o maior número de genótipos. No método de Tocher, o grupo 𝐼 reuniu 68,96% dos genótipos e no de 𝑘 −médias, 44,83% no grupo 𝐼𝐼𝐼. Todos os métodos hierárquicos foram validados pelo coeficiente de correlação cofenética, no qual o de maior coeficiente ocorreu no método do Vizinho mais próximo para todos os dados, indicando uma melhor adequação deste método. Além disso, os genótipos 5 e 27 mostraram- se de extrema importância para o estudo da divergência genética. Assim, independentemente do procedimento, foi possível identificar os genótipos mais dissimilares, podendo contribuir para outras pesquisas.Palavras-chave: Critério de agrupamento. Diversidade genética. Melhoramento de Capsicum. Método das 𝑘 −médias. Método de Tocher.Item Metodologia Gage R&R: uma abordagem de estimação intervalar via método delta multivariado(Universidade Federal de Viçosa, 2022-05-25) Teixeira, Camila Cristina; Barbosa, Eduardo Campana; http://lattes.cnpq.br/2578067704033833A qualidade dos mais variados processos de produção está diretamente associada à análise estatística de dados coletados dos mesmos. Portanto, para tentar minimizar a probabilidade de fracassos ou de falhas, métodos estatísticos são utilizados. Um dos estudos mais tradicionais para avaliar um sistema de medição é denominado como Gage R&R (MSA, 2010; MONTGOMERY; RUNGER, 1993), em que a variação total do sistema é decomposta em, principalmente, duas partes: Repetibilidade e Reprodutibilidade. Logo, o objetivo deste trabalho é realizar o estudo de Gage R&R, via método da Análise de Variância (ANOVA), para estimar os quadrados médios associados aos fatores aleatórios operador e peça, e, em seguida, através do Método dos Momentos, obter os estimadores para as componentes de variância associadas a Repetibilidade e a Reprodutibilidade. Posteriormente, estima-se o índice R&R (%) e obtêm-se um intervalo de confiança assintótico, que permite classificar o sistema de medição quanto a sua adequação, de acordo com um quadro de referência utilizado por acadêmicos e profissionais atuantes nas indústrias. Palavras-chave: Intervalo de Confiança. Operador. Peça. Qualidade. Repetibilidade. ReprodutibilidadeItem Determinação de blocos experimentais utilizando geoestatística, componentes principais e técnicas de agrupamento(Universidade Federal de Viçosa, 2022-02-25) Silva, Gustavo Henrique; Carneiro, Antônio Policarpo Souza; http://lattes.cnpq.br/3131157185222571Em experimentos que envolvem o princípio do controle local, a determinação mais assertiva dos blocos experimentais é um ponto que se destaca no planejamento experimental. Uma forma interessante de realizar tal procedimento seria a utilização de técnicas que analisam e agrupam regiões do solo que sejam mais semelhantes entre si, definindo assim blocos mais homogêneos. Assim, objetivou-se definir blocos experimentais para experimentos agrícolas utilizando técnicas de geoestatística, análise de componentes principais e técnicas de agrupamento. Foram usados dados de variáveis químicas de solo de um experimento com cana-de-açúcar. As técnicas de geoestatística foram aplicadas de modo a identificar e caracterizar a variabilidade espacial das variáveis químicas, bem como realizar a krigagem em locais não amostrados. Foi aplicado a técnica de análise de componentes principais, visando reduzir a quantidade de variáveis. Por último, a técnica de agrupamento k-means foi usada para formar os blocos usando os componentes principais que explicaram boa parte da variabilidade contida nas variáveis originais. Das 12 variáveis químicas do solo 10 apresentaram dependência espacial sendo os locais não amostrados interpolados via krigagem ordinária. Os dois outros atributos foram interpolados via técnica do inverso da distância. A análise de componentes principais permitiu reduzir a dimensionalidade dos dados de 12 variáveis para duas, explicando 82,27% da variância inicial. A área experimental foi dividida em 2, 3, 4 e 5 blocos através do algoritmo k-means sendo esses de formato e áreas diversas. A metodologia proposta se mostrou eficaz na delimitação dos blocos, uma vez que esses se apresentam bem uniformes para as variáveis químicas de solo. Palavras-chave: variabilidade espacial. Controle local. Precisão experimental. Krigagem. Delineamento experimental. K-means.Item Desempenho da análise de regressão linear realizada sob o delineamento em blocos casualizados(Universidade Federal de Viçosa, 2022-02-21) Alassane, Daibou; Ribeiro Júnior, José Ivo; http://lattes.cnpq.br/6945776532964962Nas ciências agrárias, muitos experimentos são conduzidos com um ou dois fatores quantitativos sob o delineamento em blocos casualizados (DBC) e com quatro repetições por tratamento, cujas respostas são analisadas por meio da análise de regressão linear. O objetivo deste trabalho foi de avaliar os efeitos dos números de tratamentos e de repetições sobre o desempenho do modelo de regressão linear com uma e duas variáveis independentes e com dados coletados de experimentos instalados sob o DBC. Inicialmente, foi estabelecida uma equação de regressão linear simples para o estudo de uma variável e outra equação de regressão linear múltipla para o estudo de duas variáveis independentes. Em seguida, foram realizadas simulações de acordo com a distribuição normal para os erros do modelo de regressão com média populacional igual a zero e desvios-padrão populacionais para fornecerem diferentes precisões proporcionadas pelos respectivos coeficientes de variação iguais a 10, 20 e 30%. Além disso, foram realizadas três simulações para cada desvio-padrão, separadamente. No total, foram gerados 75.000 conjuntos de dados para o estudo da análise de regressão linear simples e 15.000 para o estudo da análise de regressão linear múltipla. E por fim, para cada uma das medidas avaliadas para verificar o desempenho dos modelos de regressão em função dos diferentes números de tratamentos e de repetições, foi realizada uma análise de superfície de resposta. Para o ajuste de um modelo de regressão linear simples em um experimento instalado sob o DBC, concluiu-se que para um mesmo número de unidades experimentais, o melhor é planejar o menor número possível de níveis quantitativos. Se houver uma expectativa para o modelo linear, pode-se então, recomendar apenas dois níveis quantitativos. Caso contrário, recomendam-se três. Para o ajuste de um modelo de regressão linear múltipla com duas variáveis independentes em um experimento instalado sob o DBC, concluiu-se, do mesmo modo, que para um mesmo número de unidades experimentais, o melhor é planejar, também, o menor número possível de combinações entre os níveis quantitativos das duas variáveis independentes. Se houver uma expectativa para o modelo com apenas efeitos lineares, pode-se então, recomendar apenas dois níveis quantitativos por variável independente avaliados em um fatorial 2 x 2. Caso contrário, recomendam-se três níveis por variável avaliados em um fatorial 3 x 3. Em ambos os casos, todos os tratamentos avaliados com o maior número possível de repetições. Palavras-chave: Tratamentos. Repetições. Precisão experimental.Item Análise de estilo baseada em retornos: um estudo aplicado aos fundos de previdência complementar oferecidos pelo instituto Agros(Universidade Federal de Viçosa, 2021-11-04) Prates, Carlos Victor Bragatto; Barbosa, Eduardo Campana; http://lattes.cnpq.br/4525845624417719A introdução do Plano Real, em 1994, promoveu uma profunda mudança no cenário econômico nacional, bem como na postura do cidadão brasileiro, no que se refere a gestão do seu patrimônio pessoal e a escolha de estratégias e instrumentos financeiros, que permitam uma administração eficiente do mesmo. Nesse sentido, uma categoria de investimento que vem se destacando é a dos planos de previdência privada, uma importante alternativa para auxiliar o brasileiro no planejamento e no acúmulo de recursos para o futuro. Logo, o objetivo deste trabalho é aplicar a metodologia da Análise de Estilo Baseada em Retornos ou RBSA (do inglês, Return Based Style Analysis), para avaliar as estratégias de investimento ou de alocação de recursos e os retornos de dois planos previdenciários (B e CD) oferecidos pelo Agros, um Instituto da UFV de Seguridade Social, que oferece e administra planos de previdência privada e de saúde, com o intuito de suplementar os benefícios pagos pela previdência social aos servidores e ex-servidores da Universidade Federal de Viçosa (UFV). A referida metodologia utiliza um modelo de regressão linear múltipla, que através da imposição de algumas restrições paramétricas, busca estimar o percentual de alocação de um fundo a determinadas classes de ativos, descritas à priori nos documentos regulatórios do mesmo. Palavras-chave: Economia. Gestão. Investimentos. Restrições paramétricas. Regressão linear múltipla.Item Análise de fatores aplicada em estudos de seleção genômica no melhoramento de Coffea canephora(Universidade Federal de Viçosa, 2020-02-20) Paixão, Pedro Thiago Medeiros; Nascimento, Ana Carolina Campana; http://lattes.cnpq.br/0114089076153492O Brasil se destaca em âmbito mundial na produção de café. Os incrementos observados em sua produtividade é resultado do aprimoramento de diversas metodologias. Dentre elas, destacam-se os métodos preditivos de valor genético. Estes contribuem significativamente na seleção de genótipos superiores, de forma a aumentar o ganho genético por unidade de tempo. Neste contexto, a seleção genômica ampla (GWS) é uma ferramenta que se destaca, uma vez que permite predizer o fenótipo futuro de um indivíduo baseado apenas em informações de marcadores moleculares. Realizar a seleção de maneira simultânea para várias características é o interesse da maioria dos programas de melhoramento, e a análise de fatores (AF) tem sido utilizada para auxiliar neste fim. A utilização de fatores se justifica devido a existência de correlações genéticas entre as características, as quais podem ser atribuídas aos QTL que têm efeitos pleiotrópicos ou aos QTL estreitamente ligados. Dessa forma, o objetivo deste trabalho foi de avaliar o uso da AF no contexto de GWS, em genótipos de Coffea canephora. Os resultados obtidos da seleção baseada nos fatores foram comparados, por meio da capacidade preditiva, acurácia e do coeficiente de Cohen’s Kappa, com aqueles advindos da análise das variáveis individuais. Para isso, foram utilizados dados fenotípicos e genotípicos de populações compostas por clones dos grupos varietais Conilon e Robusta e por híbridos originados de cruzamentos entre estes grupos, avaliados durante três anos consecutivos (2014 a 2016), e uma densidade de 18111 marcadores SNPs identificados. A partir dos resultados observados, verificou-se que a AF foi eficiente para elucidar as relações entre as características e originar novas variáveis. Os fatores formados são interessantes em termos de seleção, pois além de permitirem interpretações conjuntas, apresentam boas estimativas de capacidade preditiva, herdabilidade e acurácia. Ademais observou-se alta concordância entre os indivíduos selecionados com base nos fatores e aqueles selecionados considerando as variáveis individuais. Entretanto, cabe destacar que, a seleção baseada nos fatores conseguiu selecionar indivíduos de porte mais adequado. Palavras-chave: Predição Genômica. Análise Multivariada. Melhoramento Genético.Item Comparação dos ajustes de modelos com erro normal e skew-normal(Universidade Federal de Viçosa, 2020-10-16) Nascimento, Jhennifer dos Santos; Emiliano, Paulo César; http://lattes.cnpq.br/3797894381138113Na modelagem de fenômenos aleatórios, em que uma variável aleatória quantitativa é estudada em função de uma variável aleatória qualitativa, é muito comum ser utilizada a análise de variâncias (ANOVA). Porém, para essa análise ser validada é necessário que quatro pressuposições sejam ve- rificadas com testes estatísticos, dentre elas, a normalidade do componente aleatório do modelo. Entretanto, na prática, alguns resultados de ensaios experimentais violam uma ou mais pressuposi- ções da ANOVA tornando-se necessária uma outra metodologia para analisar os dados. Com isso, o objetivo deste trabalho é, em vez de utilizar a metodologia anteriormente mencionada, fazer o ajuste de um delineamento inteiramente casualizado (DIC), atribuindo a distribuição skew-normal para o componente aleatório do modelo, utilizando o método da máxima verossimilhança. Neste estudo, foram utilizados dois conjuntos de dados não normais com indícios de dispersão assimetria que foram imprescindíveis para fazer comparação, através dos critérios de comparação AIC e BIC, entre a distribuição skew-normal e o seu submodelo normal. Para o primeiro conjunto de dados, referente a temperatura, foi ajustado um modelo de intercepto, e o segundo conjunto de dados refere-se a um experimento realizado segundo um DIC, que avaliou o percentual de gordura de idosos que praticaram diferentes intervenções de atividade física. Neste trabalho, conduziu-se todos os testes de comparação de contrastes de duas médias e intervalos de confiança para a distribuições normal e skew-normal. Além dos critérios de informação de Akaike e Bayesiano, para avaliar o ajuste dos modelos aos dados, foi realizada análise de resíduos quantílicos, e para finalizar, foram realizados estudos de simulação para avaliar inferência e as propriedades assintóticas dos estimado- res da distribuição skew-normal para os modelos ajustados. Conclui-se, assim, que esses estimadores ganham eficiência com o aumento do tamanho das amostras e fornecem melhores estimativas dos dados estudados em relação a distribuição normal, fato que foi comprovado no estudo dos envelopes simulados utilizando resíduos quantílicos e no estudo de simulação. Palavras-chave: Assimetria. Delineamentos experimentais. Monte Carlo. Verossimilhança.Item Métodos aplicados aos estudos de associação genômica via regiões cromossômicas considerando efeitos aditivos e de dominância(Universidade Federal de Viçosa, 2021-03-01) Lima, Leísa Pires; Azevedo, Camila Ferreira; http://lattes.cnpq.br/1919088712911346Os avanços na biologia molecular e as inovações nas tecnologias de sequenciamento e de genotipagem permitiram o desenvolvimento de novos marcadores moleculares favorecendo os estudos de associação genômica ampla (Genome Wide Association Studies - GWAS). A análise via marcas únicas se destaca como o principal procedimento para estudar a associação entre marcas e QTL (Quantitative Trait Loci), porém metodologias que consideraram grupos de marcadores para flanquear regiões genômicas vem elucidando importantes resultados para estudos de associação. Várias abordagens estatísticas veem sendo propostas no âmbito da GWAS, no entanto, estudos comparativos revelam que os métodos bayesianos são superiores em termos do poder em detectar marcadores com associações significativas. Entre os critérios existentes de seleção de regiões se destacam, a seleção pela porcentagem da variância explicada por regiões genômicas (%var), o critério de seleção de tagSNPs (tagSNPs) e a seleção com base na probabilidade a posteriori da associação de regiões genômicas (WPPA - Window Posterior Probability of Association). Para também detectar regiões potencialmente associadas, foi proposto o critério baseado na probabilidade a posteriori do intervalo (Posterior Probability of Interval - 𝑃𝑃 𝑖𝑛𝑡 ) que visa selecionar regiões com base nos marcadores de maiores efeitos estimados via método bayesiano, neste estudo o BayesD𝜋. Além disso, uma metodologia alternativa, denominada mapeamento de herdabilidades regionais (Regional Heritability Mapping - RHM) vem apresentando importantes resultados. Dessa forma, o primeiro capítulo deste trabalho consiste em uma revisão de literatura sobre a GWAS apresentando sua definição e importância no melhoramento genético e abordando detalhes teóricos acerca dos critérios citados acima. Já o capítulo 2 visa propor a medida 𝑃𝑃 𝑖𝑛𝑡 e compará-la às demais abordagens, tagSNP, %var, WPPA conjuntamente ao BayesD𝜋 e metodologia de marcas únicas, quanto a eficiência em selecionar e identificar marcadores ou regiões associados a QTL. Para isso, utilizou-se dados simulados considerando seis cenários diferentes, sendo os SNPs alocados em regiões genômicas não sobrepostas. Os resultados do segundo capítulo indicaram que para características com herança oligogênica, o critério WPPA seguido dos critérios %var e 𝑃𝑃 𝑖𝑛𝑡 se mostraram superiores, apresentando maiores valores de poder de detecção, capturando maiores porcentagens de variância genética e maiores áreas. Para características com herança poligênica, os critérios 𝑃𝑃 𝑖𝑛𝑡 e WPPA foram considerados superiores aos demais. Ademais, o capítulo 3 avalia os critérios, 𝑃𝑃 𝑖𝑛𝑡 e WPPA, que se mostraram superiores no capítulo 2 junto aos métodos de análise via marcas únicas e o RHM. No entanto, a eficiência em termos de poder de detecção e de falsos positivos destes métodos foi avaliada considerando ou não a inclusão dos efeitos de dominância nos modelos estatísticos. Para isso, foram utilizados dados simulados em dezoito cenários com diferentes níveis de herdabilidade, arquitetura genética e grau médio de dominância. Os resultados indicaram que para os efeitos aditivos considerando características com arquitetura genética oligogênica, os critérios WPPA, RHM e 𝑃𝑃 𝑖𝑛𝑡 se mostraram superiores para todos os graus de dominância analisados. Já para características com herança poligênica, os critérios 𝑃𝑃 𝑖𝑛𝑡 e WPPA podem ser considerados superiores aos demais. Considerando apenas os efeitos devido à dominância, os critérios WPPA, RHM, análise via marcas únicas e 𝑃𝑃 𝑖𝑛𝑡 apresentaram resultados relevantes com relação as medidas de eficiência para as características controladas por 3 QTL. Palavras-chave: Regiões Genômicas. Marcadores Moleculares. Métodos Bayesianos. Variância Genética.