Estatística Aplicada e Biometria
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/195
Navegar
Item Abordagem Bayesiana do modelo AR(1) para dados em painel: uma aplicação em dados temporais de microarray(Universidade Federal de Viçosa, 2008-12-05) Morais, Telma Suely da Silva; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4248026D5; Martins Filho, Sebastião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723282T5; Caetano, Sidney Martins; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4706384A9Considerou-se uma análise Bayesiana do modelo auto- regressivo de primeira ordem, AR(1), para dados em painel, de forma a utilizar a função de verossimilhança exata, a análise de comparação de distribuições a priori e a obtenção de distribuições preditivas de dados futuros. A eficiência da metodologia proposta foi avaliada mediante um estudo de simulação, no qual a distribuição Beta Generalizada foi usada para representar 3 diferentes prioris: simétrica, assimétrica e constante. Realizou-se uma aplicação em dados reais de expressão gênica temporal de células HeLa gerados por microarray. Os resultados mostraram alta eficiência na previsão da expressão gênica para um instante futuro.Item Classificação multivariada de modelos de crescimento para grupos genéticos de ovinos de corte(Universidade Federal de Viçosa, 2010-02-11) Silveira, Fernanda Gomes da; Silva, Carlos Henrique Osório; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4785396A6; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://lattes.cnpq.br/0551611721454653; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Carneiro, Antônio Policarpo Souza; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4799449E8; Nascimento, Carlos Souza do; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4734058H3O objetivo principal desse trabalho foi utilizar a análise de agrupamento para classificar modelos de crescimento não-lineares tendo em vista os resultados de diferentes avaliadores de qualidade de ajuste ao considerar dados dos seguintes grupos genéticos de ovinos de corte: Dorper x Morada Nova (DMN), Dorper x Rabo Largo (DRL) e Dorper x Santa Inês (DSI). Após a indicação do modelo comum adequado aos três grupos, objetivou-se também aplicar a identidade de modelos com o intuito de identificar o grupo genético com maior eficiência de crescimento. Toda a metodologia foi aplicada a duas situações experimentais distintas: com repetição, considerando todos os animais de cada grupo genético, e sem repetição, considerando dados médios de cada um destes grupos. Ajustaram-se doze modelos não-lineares, cuja qualidade de ajuste foi medida pelo coeficiente de determinação ajustado (R2 aj), critério de informação de Akaike (AIC), critério de informação Bayesiano (BIC), erro quadrático médio de predição (MEP) e coeficiente de determinação de predição (R2 p). Os modelos Richards e von Bertalanffy foram, respectivamente, os que apresentaram os melhores ajustes para os conjuntos de dados médios e individuais. De acordo com testes de identidade de modelos, o grupo genético DSI foi o que apresentou maior peso adulto, sendo este, portanto, o mais recomendado para exploração de carne.Item Métodos de redução de dimensionalidade aplicados na seleção genômica para características de carcaça em suínos(Universidade Federal de Viçosa, 2012-07-26) Azevedo, Camila Ferreira; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Resende, Marcos Deon Vilela de; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4709374E4; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://lattes.cnpq.br/8861113007032888; Nascimento, Carlos Souza do; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4734058H3; Lopes, Paulo Sávio; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4783377H1A principal contribuição da genética molecular no melhoramento animal é a utilização direta das informações de DNA no processo de identificação de animais geneticamente superiores. Sob esse enfoque, a seleção genômica ampla (Genome Wide Selection GWS), a qual consiste na análise de um grande número de marcadores SNPs (Single Nucleotide Polymorphisms) amplamente distribuídos no genoma, foi idealizada. A utilização dessas informações é um desafio, uma vez que o número de marcadores é muito maior que o número de animais genotipados (alta dimensionalidade) e tais marcadores são altamente correlacionados (multicolinearidade). No entanto, o sucesso da seleção genômica ampla deve-se a escolha de metodologias que contemplem essas adversidades. Diante do exposto, o presente trabalho teve por objetivo propor a aplicação dos métodos de regressão via Componentes Independentes (Independent Component Regression ICR), regressão via componentes principais (Principal Component Regression PCR), regressão via Quadrados Mínimos Parciais (Partial Least Squares PLSR) e RR-BLUP, considerando características de carcaça em uma população F2 de suínos proveniente do cruzamento de dois varrões da raça naturalizada brasileira Piau com 18 fêmeas de linhagem comercial (Landrace × Large White × Pietrain), desenvolvida na Universidade Federal de Viçosa. Os objetivos específicos foram estimar Valores Genéticos Genômicos (Genomic Breeding Values GBV) para cada indivíduo avaliado e estimar efeitos de marcadores SNPs, visando a comparação dos métodos. Os resultados indicaram que o método ICR se mostrou mais eficiente, uma vez que este proporcionou maiores valores de acurácia na estimação do GBV para a maioria das características de carcaça.Item Métodos estatísticos aplicados à análise de dados de etiqueta de sequência expressa(Universidade Federal de Viçosa, 2011-02-11) Paula, Fernanda Vital de; Nascimento, Carlos Souza do; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4734058H3; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://lattes.cnpq.br/9279556456110004; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Santos, Gérson Rodrigues dos; http://lattes.cnpq.br/0674757734832405; Caetano, Sidney Martins; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4706384A9Pesquisas de Expressed Sequence Tags (ESTs) são uma ferramenta fundamental para identificação de genes em estudos de seqüenciamento de vários organismos. Dado uma amostra preliminar de EST de uma certa biblioteca de cDNA, vários problemas estatísticos de predição podem surgir. Em particular, é de interesse calcular o número de genes, Δ(t), que podem ser descobertos em uma amostra futura de EST t vezes maior que a amostra original. Esta e outras estatísticas, apresentadas por Susko e Roger (2004), tais como cobertura e o número de leituras necessárias para se descobrir um novo gene são úteis para direcionar protocolos de sequenciamento por meio do cálculo do grau de redundância de uma biblioteca de cDNA. Este cálculo visa maximizar a obtenção de genes durante um sequenciamento de ESTs, porém, este ainda é visto como um procedimento de custo elevado e adequações de técnicas para redução de tal custo é de fundamental importância. O presente trabalho tem como objetivo apresentar os aspectos teóricos da metodologia proposta por Susko e Roger (2004), implementá-la computacionalmente no software livre R e principalmente propor uma abordagem bayesiana para a estimação de Δ(t). Toda a metodologia foi aplicada a dois conjuntos de dados: o primeiro diz respeito a duas bibliotecas de cDNA referentes ao organismo Mastigamoeba Balamuthi e o segundo a duas bibliotecas de cDNA referentes à pele de bovinos F2 (Holandês × Gir) infestados pelo carrapato Riphicephalus (Boophilus) microplus. Para os dois conjuntos de dados as estimativas por intervalo obtidas para Δ(t) foram consideravelmente mais precisas quando se utilizou a inferência bayesiana, indicando que a mesma apresenta-se como uma alternativa viável para estudos relacionados ao cálculo da redundância em análises de ESTs.Item Métodos estatísticos na seleção genômica ampla para curvas de crescimento em animais(Universidade Federal de Viçosa, 2011-06-20) Rocha, Gilson Silvério da; Resende, Marcos Deon Vilela de; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4709374E4; Peternelli, Luiz Alexandre; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4723301Z7; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://lattes.cnpq.br/1379925612863697; Nascimento, Carlos Souza do; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4734058H3; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6O principal atrativo da genética molecular em benefício do melhoramento genético aplicado é a utilização direta das informações do DNA na seleção genômica, de modo a permitir alta eficiência seletiva, rapidez na obtenção de ganhos genéticos com a seleção e baixo custo. Uma forma prática e consistente de analisar a eficiência produtiva de animais de corte sujeitos à seleção é por meio dos estudos de curvas de crescimento, pois estas representam uma trajetória longitudinal dos pesos dos animais em função do tempo. Para isso, primeiramente ajustam-se modelos de crescimento (modelos não lineares) aos dados de peso-idade de cada animal submetido à seleção e consideram-se os parâmetros estimados como fenótipos. Este procedimento permite a obtenção de estimativas de parâmetros genéticos para qualquer ponto da trajetória de crescimento e possibilita a compreensão da arquitetura genética de toda a trajetória, uma vez que as informações de todas as pesagens são condensadas por esses poucos parâmetros interpretáveis biologicamente. Em seguida, os parâmetros estimados dos modelos de crescimento são utilizados para predizer os Valores Genéticos Genômicos (Genomic Breeding Value – GBV) por meio de métodos estatísticos específicos para a Seleção Genômica ix Ampla (Genome Wide Selection – GWS). O objetivo geral do presente trabalho foi empregar métodos estatísticos usados na Seleção Genômica Ampla, especificamente o RR-BLUP/GWS e o LASSO Bayesiano, no estudo de curvas de crescimento animal, considerando como variáveis fenotípicas as estimativas dos parâmetros de modelos de regressão não linear. Os objetivos específicos foram: estimar valores genéticos genômicos para cada indivíduo avaliado; estimar efeitos de marcadores SNPs e identificar os de maiores efeitos; selecionar, via técnicas de agrupamento, grupos de indivíduos geneticamente superiores em relação à curva de crescimento; e validar toda metodologia utilizada via estudo de simulação e aplicá-la a dados reais de uma população F2 de suínos proveniente do cruzamento de dois varrões da raça naturalizada brasileira Piau com 18 fêmeas de linhagem comercial (Landrace × Large White × Pietrain). Os resultados indicaram que os métodos estatísticos na Seleção Genômica Ampla foram eficientes no estudo de curvas de crescimento, considerando dados simulados e dados reais de peso-idade de suínos. A GWS apresentou alta acurácia na seleção para a trajetória das curvas de crescimento e possibilitou a detecção de QTLs (Quantitative Trait Loci) para os parâmetros da curva dos indivíduos considerados. Na ausência de genes de grande efeito, os métodos RRBLUP/ GWS e LASSO Bayesiano produziram resultados semelhantes, no entanto o método LASSO Bayesiano apresentou maior eficiência quando o gene halotano, caracterizado como de grande efeito, foi incluído como marcador nas análises.Item Modelagem hierárquica Bayesiana na avaliação de curvas de crescimento de suínos genotipados para o gene halotano(Universidade Federal de Viçosa, 2013-07-31) Macedo, Leandro Roberto de; Cirillo, Marcelo ângelo; http://lattes.cnpq.br/9705001233749286; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://lattes.cnpq.br/1661203785619531; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945; Paixão, Débora Martins; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4779007P3Para avaliar a influência do gene halotano sobre a curva de crescimento de suínos, bem como sua interação com o sexo do animal, foi proposta uma modelagem hierárquica Bayesiana. Nesta abordagem, os parâmetros dos modelos não-lineares de crescimento (Logístico, Gompertz e von Bertalanffy) foram estimados conjuntamente com os efeitos de sexo e genótipos do gene halotano. Foram utilizados 344 animais F2(Comercial x Piau) pesados ao nascer, aos 21, 42, 63, 77, 105 e 150 dias. O modelo Logístico foi aquele que apresentou melhor qualidade de ajuste por apresentar menor DIC (Deviance Information Criterion) que os demais. As amostras das distribuições marginais a posteriori para as diferenças entre as estimativas dos parâmetros do modelo Logístico indicaram que o peso dos machos à idade adulta com genótipo heterozigoto (HALNn) foi superior ao dos homozigotos (HALNN). A título de comparação, também foi considerada a abordagem frequentista tradicional baseada em dois passos distintos, a qual, por apresentar um menor poder de discernimento estatístico, não mostrou diferenças significativas.Item Regressão aleatória na detecção de QTL para características de crescimento de suínos(Universidade Federal de Viçosa, 2012-02-24) Pinheiro, Valéria Rosado; Resende, Marcos Deon Vilela de; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4709374E4; Cruz, Cosme Damião; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788274A6; Silva, Fabyano Fonseca e; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4766260Z2; http://lattes.cnpq.br/2053096765751475; Nascimento, Carlos Souza do; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4734058H3; Cecon, Paulo Roberto; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4788114T5; Nascimento, Moysés; http://lattes.cnpq.br/6544887498494945Muitos estudos são voltados para a busca de QTL (locos de características quantitativas) que afetam características de crescimento em suínos, sendo que a quase totalidade tem encontrado QTL com efeitos significativos. No entanto, a maioria destes estudos utiliza informações referentes a peso corporal em idades específicas ou ganho de peso médio. Dessa forma, torna-se interessante avaliar simultaneamente todas as informações de crescimento sob o enfoque de dados longitudinais. O presente trabalho tem como objetivo utilizar modelos de regressão aleatória (MRA) com o intuito de detectar QTL para características de crescimento em suínos de uma população F2 Piau x Comercial. Para tanto, considerou-se MRAs com efeitos aleatórios poligênico, de ambiente permanente e de QTL, sendo a matriz de covariância associada a este último denominada de IBD (identical-by-descent). A presença de um QTL com efeito significativo foi verificada mediante teste de razão de verossimilhanças considerando o modelo descrito como sendo o completo e o mesmo sem o efeito de QTL como sendo o modelo nulo. As comparações entre estes modelos foram realizadas nas posições dos marcadores (6 marcadores microssatélites) e nas posições entre marcadores. Na posição com maior evidência de efeito de QTL foi calculada a herdabilidade e os valores genéMany studies are focused on the search for QTL(quantitative trait loci) that affects growth traits in swine, and almost all studies have found QTL with significant effects. However, most of these studies use information related to the body weight on specific ages or average weight gain. Thus, it becomes interesting to evaluate all the growth information with the focus on longitudinal data simultaneously. This study aims to use random regression models (RRM) in order to detect QTL (quantitative trait loci) for growth traits in swine from a population F2 Piau x Commercial. To this end, it was considered a RRM with random polygenic effects, permanent environment and QTL, being the covariance matrix associated with the latter known as IBD (identical-by-descent). The presence of a significant QTL was found by likelihood ratio test considering the model described above as being the complete and this same without the QTL effect as null model. Comparisons between these models were made at the positions of the markers (6 microsatellite markers) and at positions between markers. In the position with greater evidence of QTL effect was calculated the heritability and the genetic polygenic and QTL values for body weight throughout the growth period studied. The results showed a significant effect of QTL at position 65 of chromosome 7.ticos poligênicos e de QTL para peso em todo o período de crescimento estudado. Os resultados mostraram um efeito significativo de QTL na posição 65 do cromossomo 7.