Ciência da Computação
URI permanente para esta coleçãohttps://locus.ufv.br/handle/123456789/197
Navegar
238 resultados
Resultados da Pesquisa
Item Métodos híbridos de otimização combinatória e aprendizado por reforço para problemas integrados de produção e distribuição(Universidade Federal de Viçosa, 2024-10-09) Araújo, Matheus de Freitas; Nogueira, Thiago Henrique; http://lattes.cnpq.br/3969976723526958Item Geração automática de aceleradores de domínio específico em FPGA(Universidade Federal de Viçosa, 2024-05-03) Silva, Lucas Bragança da; Nacif, Jose Augusto Miranda; http://lattes.cnpq.br/9858970345247106Devido à sua eficiência energética e alta flexibilidade, os FPGAs (Field Programmable Gate Arrays), ou Arranjos de Portas Programáveis em Campo, têm desempenhado um papel relevante na computação, atuando como aceleradores de hardware especializados. No entanto, a programação e implantação de aceleradores em plataformas com FPGA ainda representam um desafio. Esta tese apresenta uma metodologia que visa automatizar o projeto de aceleradores em FPGAs por meio de um conjunto de ferramentas para geração de arquiteturas com um fluxo de síntese programável e flexível. A metodologia proposta foi desenvolvida em três etapas. Na primeira etapa, o objetivo foi entender os principais desafios relacionados ao projeto de aceleradores em FPGAs. Para isso, foram desenvolvidas duas abordagens que tratam de geradores de aceleradores para duas aplicações específicas. Na primeira abordagem, apresentamos um gerador de aceleradores em FPGA para o algoritmo K-means. O framework proposto é altamente parametrizável e gera código HDL (Hardware Description Language), ou Linguagem de Descrição de Hardware, para o projeto completo, pronto para ser implantado em uma plataforma de FPGA na nuvem. Como resultado, o acelerador proposto apresentou ganhos de tempo de execução de 1,98 vezes quando comparado com outro acelerador em uma plataforma com FPGA altamente acoplada. Na segunda abordagem, propomos um gerador de aceleradores para simulações de GRNs (Genes Regulator Networks), ou Redes Reguladoras de Genes, usando FPGAs na nuvem. Este gerador cria automaticamente todo o conjunto de hardware/software a partir de uma descrição em alto nível de um modelo de GRN. Utilizamos seis modelos GRN propostos na literatura para comparar o desempenho e o custo com implementações em CPU (Central Processing Unit), ou Unidade Central de Processamento, GPU (Graphics Processing Unit), ou Unidade de Processamento Gráfico, e FPGA. Como resultado, o acelerador em FPGA é pelo menos 12 vezes mais rápido do que o melhor acelerador em GPU avaliado, e oferece o melhor desempenho por dólar em serviços em nuvem, pelo menos 5 vezes melhor do que o melhor acelerador em GPU. Na segunda etapa desta tese, apresentamos um framework chamado REconfigurable Accelerator DeploY (READY), o primeiro framework a oferecer suporte ao mapeamento de aplicações em grafo de fluxo de dados em plataformas CPU-FPGA de alto desempenho em tempo de execução. READY introduz um mapeamento eficiente em uma arquitetura de CGRA (Coarse Grained Reconfigurable Architecture), ou Arquitetura Reconfigurável de Granularidade Grossa, que oculta a latência da rede de interconexão global executando múltiplas tarefas. Além disso, demonstramos como esse sistema contribui para resolver alguns dos desafios relacionados à adoção de aceleradores de domínio específico em FPGAs. Os resultados dessa abordagem mostraram que é possível mapear e executar aplicações de grafo de fluxo de dados de forma eficiente, e o desempenho do sistema resulta em uma aceleração de até 2 vezes em comparação com uma CPU moderna. E, por fim, a terceira e última etapa desta tese apresenta o High Performance Coarse Grained Reconfigurable Accelerator (HPCGRA), uma ferramenta projetada para gerar aceleradores de domínio específico com interconexões multidimensionais de forma flexível. O CGRA é gerado utilizando os principais blocos de construção, como unidades funcionais, padrões de interconexão, roteamento e recursos de filas elásticas, palavras de configuração e memórias. O HPCGRA otimiza e simplifica o processo de criação de arquiteturas por meio de uma descrição portátil, gerando um código Verilog RTL genérico e eficiente. Os resultados da síntese mostram que, mesmo aumentando o número de PEs (Processing Elements), ou Elementos de Processamento, das arquiteturas geradas pelo HPCGRA, a frequência de clock e a relação do uso de recursos por PE permanecem estáveis. Foi possível sintetizar arquiteturas de CGRAs com 3036 PEs, com desempenho teórico de 1,2 TOPS. Palavras-chave: fpga; cgra; dsa; rdsa; hpcgraItem Análise de implementações de random forests em FPGAs para computação embarcada(Universidade Federal de Viçosa, 2024-07-09) Silva, Alysson Kelvim Caetano da; Ferreira, Ricardo Dos Santos; http://lattes.cnpq.br/9760774487361777Item ISiM: proposta de uma métrica para simplificação de sentenças em linguagem natural(Universidade Federal de Viçosa, 2024-06-03) Costa, Lucas Mucida; Oliveira, Alcione de Paiva; http://lattes.cnpq.br/4192005936413557Em uma sociedade complexa, a habilidade de simplificar textos pode ser bastante útil. Uma comunicação clara, concisa e de fácil compreensão são características bem-vindas na interação entre pessoas. Em virtude dessa necessidade, pesquisas voltadas ao desen- volvimento de modelos capazes de produzir textos mais simples importantes, e a busca por corpus adequados para treinar e aperfeiçoar esses modelos é um campo de pesquisa ativo. No entanto, para cumprirmos essa exigência, é necessário que possamos desenvolver métricas que possibilitem verificar o quanto uma sentença é mais simples que outra com significado similar. Nesta pesquisa, desenvolvemos uma métrica de simplificação de textos para a área de Processamento de Linguagem Natural (PLN), denominada ISiM. A mé- trica proposta supera as limitações das métricas existentes, oferecendo uma abordagem rápida, simples, livre de intervenção humana e independente da língua contribuindo na avaliação da qualidade da simplificação textual. Além disso, ISiM se demonstrou eficiente na criação e no refinamento de corpora de pares de sentenças complexo/simples, sendo essa uma contribuição para as pesquisas na área. Também, foi criado nesta pesquisa, um modelo gerador de textos simplificados, utilizando para Ąne tunning um corpus otimizado pela métrica ISiM. Durante os experimentos, a métrica demonstrou sua eficácia em di- versas aplicações, como sua velocidade ao gerar resultados em poucos segundos, obtendo uma taxa de acerto de 96,94% ao ser testada em um corpus existente de pares de frase complexo/simples, 77,5% de acerto ao confrontada com um formulário respondido por humanos, e também superando outros modelos de geração de frases simplificadas da li- teratura. Além disso, a pesquisa destaca a relevância social da simplificação de textos, especialmente em um contexto como o do Brasil, onde o analfabetismo funcional atinge mais de 62 milhões de pessoas, sendo um desafio significativo a ser superado. A dificuldade de compreensão de textos complexos devido à deficiências na educação da população mos- tra o quanto ainda precisamos melhorar nosso sistema de ensino, e reforça a importância de desenvolver ferramentas como a ISiM para ajudar a tornar a informação mais acessível e compreensível para todos. Palavras-chave: Inteligência Artificial; Processamento de Linguagem Natural; Simplifi- cação de Texto; Métrica; ISiM; Mucimples.Item Previsão do valor vitalício do cliente com abordagens de aprendizado de máquina(Universidade Federal de Viçosa, 2024-07-19) Ramos, João Marcos Alves Modesto; Silva, Fabrício Aguiar; http://lattes.cnpq.br/8511516221764258A mudança de paradigma para estratégias de negócio centradas no cliente demonstrou que focar na retenção de clientes e em relacionamentos de longo prazo resulta em modelos de negócios mais lucrativos e sustentáveis em comparação com abordagens centradas no produto. Essa mudança, facilitada pelos avanços na tecnologia, permite que as empresas personalizem suas ofertas com base nas preferências e comportamentos individuais dos clientes, levando a um aumento nos lucros e na satisfação dos clientes. O Valor Vitalício do Cliente (do inglês Customer Lifetime Value ou apenas CLV) é uma métrica importante para identificar os relacionamentos com clientes mais lucrativos. O CLV é definido como o valor total que um cliente contribui para uma empresa ao longo de todo o seu relacionamento. Estimar o CLV é desafiador devido aos diversos contextos dos relacionamentos com clientes, como interações contratuais versus não contratuais e discretas versus contínuas. Além disso, a disponibilidade de dados e as preocupações com a privacidade dificultam os modelos de previsão. Modelos probabilísticos tradicionais, como Cadeias de Markov, Pareto/NBD e BG/NBD, têm sido amplamente utilizados, ao contrário dos modelos baseados em aprendizado de máquina, que muitas vezes são limitados pela dependência de dados detalhados dos clientes, que nem sempre estão disponíveis ou não condizem com a ética. O objetivo desta dissertação é apresentar um modelo baseado em aprendizado de máquina para prever o CLV em diversos contextos sem utilizar dados sensíveis dos clientes, alcançando resultados competitivos com os métodos mais avançados. Os objetivos específicos incluem propor um modelo de aprendizado de máquina baseado em RFM e outro modelo que utiliza atributos mais complexos baseados em transações. Esta dissertação está organizada em dois artigos principais. O primeiro artigo, apresentado no Capítulo 2, desenvolve uma solução usando modelos probabilísticos e técnicas de aprendizado de máquina, mostrando que os modelos propostos superam os métodos probabilísticos tradicionais na previsão do número de transações. O segundo artigo, detalhado no Capítulo 3, aprimora o modelo incorporando dados relacionados às transações e testando-o em diferentes contextos, como o setor bancário, demonstrando um desempenho melhorado em todos os aspectos, particularmente na previsão do CLV. Como resultados, os modelos de aprendizado de máquina propostos fornecem uma solução generalizável para a estimativa do CLV que prioriza a privacidade dos clientes e se adapta a diversos contextos de negócios, aprimorando a capacidade das empresas de prever o valor dos clientes e personalizar seus serviços. Palavras-chave: Customer Lifetime Value. CLV. LTV. Aprendizado de Máquina.Item Um panorama sobre diversidade de gênero na indústria de jogos indie no Brasil(Universidade Federal de Viçosa, 2024-07-19) Batista, Estela Miranda; Silva, Thais Regina de Moura Braga; http://lattes.cnpq.br/0016446811901913Os jogos digitais tornaram-se uma parte fundamental da cultura global de entretenimento, e no Brasil, 50,9% das pessoas jogadoras são mulheres. No entanto, apesar desse cenário aparentemente equitativo, a literatura aponta para uma baixa representatividade feminina tanto entre os personagens dos jogos quanto nas equipes de desenvolvimento. Entre os estudos que exploram a temática de gênero em jogos digitais, a maioria tem focado nas personagens e no impacto destas em mulheres jogadoras. Um dos temas menos explorados é a participação feminina no desenvolvimento de jogos digitais. No contexto brasileiro, destacam-se as empresas de desenvolvimento de jogos indie, que representam cerca de 57% desse mercado. Jogos indie são produzidos por uma única pessoa ou por pequenas equipes. A literatura também tem apontado uma escassez de estudos que abordam a temática de gênero no desenvolvimento de jogos indie no Brasil. O objetivo desta pesquisa é identificar se existe impacto da diversidade de gênero no desenvolvimento de jogos indie no contexto brasileiro e, em caso positivo, como isso se propaga no ambiente de trabalho, no ciclo de desenvolvimento e em elementos dos jogos. Para alcançar este objetivo, a pesquisa foi realizada junto a cinco empresas brasileiras de desenvolvimento de jogos indie. Os resultados indicaram que o perfil das pessoas desenvolvedoras nas empresas participantes é semelhante ao da indústria convencional de jogos digitais, com a maioria sendo homens (59,1%) e brancos (77,3%), mas com melhores índices de participação feminina nos cargos. No ambiente de trabalho, 87,5% das mulheres destas empresas relataram enfrentar desafios relacionados à diversidade de gênero, seja neste ambiente, ou em redes sociais de negócios e empregos. Quanto ao impacto da diversidade de gênero na produtividade, as equipes mais diversas apresentaram melhores índices de produtividade em relação ao tempo de atraso, com uma média de apenas 16,5% do tempo total. Embora não haja uma correlação direta entre a diversidade das equipes avaliadas e a diversidade dos personagens nos jogos, os jogos criados por equipes mais diversas obtiveram maior aceitação do público, com uma média de 95,7% de avaliações positivas em plataformas de distribuição digital de jogos. Palavras-chave: Mulheres Desenvolvedoras. Índice Blau de Diversidade. Ciclo de Desenvolvimento.Item Abordagens computacionais baseadas em modelos de aprendizado profundo e voltadas ao deficiente visual para geração e avaliação automática de descrições textuais de cenas de webinários(Universidade Federal de Viçosa, 2024-06-17) Fernandes, Daniel Louzada; Cerqueira, Fabio Ribeiro; http://lattes.cnpq.br/0020032305489581Estudos recentes preveem que pelo menos 2, 2 bilhões de pessoas no mundo sofrem de cegueira ou alguma deficiência visual (como a baixa visão) e que esse número continuará a crescer. Essas pessoas precisarão de algum tipo de cuidado apropriado e o uso de Tecnologias Assistivas é uma forma valiosa para que elas possam mitigar seus obstáculos diários. Nesse contexto, com o rápido avanço da Inteligência Artificial e dos sistemas portáteis embarcados, tem-se testemunhado um aumento no desenvolvimento e oferecimento de vários serviços e tecnologias que proporcionam comodidade e suporte para esse público. Apesar desses avanços, muitas dessas tecnologias têm fatores restritivos, como funcionalidades limitadas ou preços elevados. Além disso, estão disponíveis apenas para uma pequena parcela da população necessitada. Com a pandemia de COVID-19, a vida cotidiana e o local de trabalho tornaram-se mais dependentes das tecnologias, como o consumo intensivo de conteúdos online e o aumento significativo no uso de ferramentas de videoconferência. Embora um mundo altamente conectado permita o trabalho remoto como substituto para o deslocamento e o trabalho de escritório – assim como webinários/videoconferências como sucessores de conferências presenciais, entrevistas, reuniões ou até mesmo aulas – isso também levanta novas barreiras de acessibilidade para as pessoas com deficiência visual. Como a informação visual é complementar à própria mensagem, a baixa ou nenhuma visão impede que essas pessoas capturem informações visuais, o que pode dificultar a compreensão do contexto geral do conteúdo compartilhado em uma apresentação remota. Com isso, aumentou-se a necessidade de prover mais acesso a informações contidas em webinários, em especial, sobre contexto. Para suprir essa necessidade, iniciativas vêm sendo realizadas no sentido de incentivar os usuários da Internet a produzirem descrições textuais de imagens on-line. No entanto, esse é um processo manual e lento que depende da disposição das pessoas com visão em ajudar. Como consequência, muitas imagens carecem de descrições ou apresentam explicações de baixa qualidade. A maioria dos métodos existentes na literatura sobre descrição automática de imagens baseados em Inteligência Artificial, quando utilizados como Tecnologias Assistivas, negligencia as necessidades de indivíduos cegos ou com baixa visão. Esses métodos tendem a comprimir todos os elementos visuais em legendas breves, criar frases desconexas para cada região da imagem ou fornecer descrições extensas, não se concentrando no fornecimento das informações pertinentes para esse grupo específico. Isso ocorre também devido à escassez de conjuntos de dados específicos para atender necessidades de deficientes visuais; logo, esses métodos são treinados em conjuntos para domínios de dados gerais, considerando o uso por pessoas com visão. Para lidar com essas limitações, nesta tese, propõe-se um conjunto de metodologias por meio da integração de técnicas de Visão Computacional e Processamento de Linguagem Natural que possibilitam a implementação e avaliação de uma abordagem para construir descrições de imagens baseada em normas e diretrizes de acessibilidade direcionadas a pessoas com deficiência visual, focando em cenas de webinários. Como parte do processo, o trabalho também desenvolve um conjunto de dados direcionado para este público e propõe uma métrica de avaliação de adequabilidade de descrição textual, levando em conta os aspectos importantes para pessoas cegas ou de baixa visão. Os experimentos demonstraram estatisticamente que a abordagem proposta produziu descrições alinhadas com o conteúdo das imagens, com características linguísticas escritas por humanos e com as diretrizes de acessibilidade para deficientes visuais, apresentando melhor desempenho nesses aspectos quando comparada a métodos anteriores de descrição de imagens. Palavras-chave: Inteligência artificial. Visão computacional. Processamento de linguagem natural. Descrição de imagens. Tecnologias assistivas. Deficiente visual.Item Explainable machine learning for effective alarm prediction(Universidade Federal de Viçosa, 2023-12-20) Abreu, Kalleb Morais de Moura; Santos, André Gustavo dos; http://lattes.cnpq.br/6334717577964043This dissertation evaluates twelve machine learning models for the prediction of alarms using geographical clustering, leveraging data from an Italian company. The models encompass a spectrum of algorithms, including Naive Bayes (NB), XGBoost (XGB), and Multilayer Perceptron (MLP), coupled with encoding techniques such as Label/Ordinal Encoding (LOE) and Label/Ordinal/One-Hot Encoding (L2OE), and clustering method- ologies, namely Coopservice-2022 (COOP) and K-Means++ (KPP). XGB emerges as the most effective, yielding the highest AUC values across models. Adjustments in encoding methods show significant improvements for NB and MLP, with a marginal impact for XGB. Hyperparameter tuning for XGB models reveals default values outper- form varied configurations. The SHAP value analyses emphasize the significant impact of a specific cluster and hour of the day. Transfer learning experiments confirm the model’s adaptability across Italian provinces, with continuous monitoring essential due to sensitivity to cluster labels. Challenges arise in handling dataset imbalances, impacting minority alarm class predictions. This work sets a foundation for further research on specific approaches for dealing with imbalanced datasets and one-class algorithms. The study advocates for ongoing validation across diverse provinces, emphasizing nuanced analyses and improvements in model robustness. Keywords: Alarms; Machine learning; Clustering; Explainable models; Transfer learning.Item Rotas alternativas centradas em usuários para veículos coletivos com segurança e distância equilibrados(Universidade Federal de Viçosa, 2024-03-19) Almeida, Vinícius Gabriel de Jesus; Silva, Thais R. M. Braga; http://lattes.cnpq.br/4076283288915070Com o aumento da disponibilidade de dados e dispositivos conectados nos centros urbanos, diferentes aplicações desenvolvidas para apoiar a construção de cidades inteligentes que fazem uso de informações contextuais estão ganhando espaço e se tornando mais comuns. Contextos são dados sobre pessoas, lugares ou objetos e os Sistemas de Transporte Inteligentes (STIs), em particular, fazem uso destes com o objetivo de aprimorar a mobilidade dos cidadãos. Neste recorte, um aspecto que vem ganhando destaque é a construção de rotas ciente de contexto. Este tipo de solução utiliza um ou mais tipos de contexto para elaborar a trajetória de agentes da cidade. Dentre os possíveis contextos a serem utilizados, a segurança é um que vem sendo bastante investigado recentemente. No entanto, embora diferentes trabalhos já tenham implementado e avaliado soluções de rotas seguras, a maioria foi testada para veículos particulares e avaliada sob o ponto de vista computacional. Este trabalho apresenta RACIONAL, um modelo genérico de cálculo de rotas seguras adaptado às peculiaridades dos coletivos urbanos. Isso inclui a necessidade de restringir as modificações propostas nas trajetórias, respeitando a cobertura da rota, e garantindo a acessibilidade aos passageiros que fazem uso e dependem deste meio de transporte. Resultados obtidos com estudos de caso realizados para dois municípios distintos, São Paulo e Curitiba, mostraram que o modelo é capaz de lidar com diferentes perfis de cidades, proporcionando soluções viáveis com um ganho significativo em segurança, associado a um baixo acréscimo de deslocamento, tanto pelos ônibus em suas rotas como dos passageiros no acesso a pontos de parada alternativos. Palavras-chave: Mobilidade Urbana; Rotas Ciente de Contexto; Transporte Público e SegurançaItem Avaliação de técnicas de reconhecimento óptico de caracteres (OCR) para análise de dados em português disseminados em plataformas de mídias sociais(Universidade Federal de Viçosa, 2024-05-03) Santos, Yago José Araújo dos; Reis, Julio Cesar Soares dos; http://lattes.cnpq.br/9560391199290724Ao mesmo tempo em que as plataformas de mídias sociais facilitaram as interações e ajudaram a democratizar o acesso à informação, estas também são exploradas para disseminação de desinformação em diferentes contextos, como saúde, política, dentre outros. Fatores como: a velocidade de disseminação, a demora na verificação de fatos e a complexidade de análise de mídias como imagens e vídeos, fazem com que o combate a essa prática seja cada vez mais desafiador. Esforços anteriores revelaram que as imagens representam o tipo de mídia mais explorado nas plataformas sociais. Neste contexto, uma abordagem para combater a desinformação em imagens é extrair o conteúdo textual para processamento posterior. Assim, o objetivo deste trabalho é investigar o desempenho de ferramentas de OCR na recuperação de informações textuais em Português do Brasil, a fim de contribuir para o desenvolvimento de sistemas de moderação e combate à desinformação cada vez mais eficientes. Este estudo apresenta uma metodologia para avaliar ferramentas de OCR considerando variações em 7 aspectos de imagem que são comumente encontrados nos recursos de edição das plataformas de mídias sociais, a saber: o ângulo de rotação do texto, as dimensões da imagem, a cor e o estilo da fonte, o tamanho da fonte, a presença de sombras no texto e o plano de fundo. Nossos resultados revelam a influência dos aspectos da imagem analisada na precisão do OCR, destacando o plano de fundo, o ângulo de rotação do texto e o estilo da fonte como os aspectos que produzem o maior impacto. Além disso, relatamos uma variação considerável entre os sistemas de OCR avaliados em termos de desempenho. Nossos experimentos demonstram que, dentre as ferramentas avaliadas, o Microsoft OCR apresenta os melhores resultados de CER em todos os aspectos analisados com valores médios variando entre 0,14% e 0,71%. Já os piores resultados são do Easy OCR, com valores médios de CER variando entre 1,5% e 57,8%, e do PyTesseract, com valores variando entre 3,9% e 35,6%. Por fim, além de realizarmos um experimento para avaliar como o desempenho das ferramentas de OCR impactam na detecção de desinformação, disponibilizamos um conjunto de imagens com desinformação em Português do Brasil que poderá ser utilizado pela comunidade acadêmica para diferentes fins. Palavras-chave: Reconhecimento Óptico de Caracteres. Desinformação. Dados sintéticos.