Q-learning-based unmanned ground vehicle navigation in warehouse-like environments

Batista, Hiago de Oliveira Braga

doi:https://doi.org/10.47328/ufvbbt.2025.488

Q-learning-based unmanned ground vehicle navigation in warehouse-like environments

dc.contributor.advisor	Brandão, Alexandre Santos
dc.contributor.author	Batista, Hiago de Oliveira Braga
dc.contributor.authorLattes	http://lattes.cnpq.br/0988173500996544
dc.date.accessioned	2025-11-10T11:12:40Z
dc.date.issued	2025-03-28
dc.degree.date	2025-03-28
dc.degree.department	Departamento de Informática	pt-BR
dc.degree.grantor	Universidade Federal de Viçosa
dc.degree.level	Mestrado
dc.degree.local	Viçosa - MG
dc.degree.program	Mestre em Ciência da Computação
dc.description.abstract	This dissertation investigates robot navigation in logistics environments, focusing on libraries and warehouses, using the Q-learning method. To this end, three studies are presented, each applying reinforcement learning to optimize task performance and navigation efficiency. The first study employs Q-learning to enhance book organization in the library of the Federal University of Viçosa, reducing planning time and movements by 20% compared to a greedy method while achieving a 100% success rate in task completion. Meanwhile, the second study proposes an offline Q- learning approach for unmanned ground vehicles in warehouses, outperforming traditional algorithms such as Dijkstra, A-star, and Breadth-First Search, with planning speeds up to seven times faster and a reduction in turns of up to 41%. Finally, the third study extends Q-learning to multi-agent navigation in libraries, integrating transfer learning and curriculum learning. As a result, simulations indicated a 94% success rate with nine agents, along with a 73.36% reduction in task steps compared to scenarios with only one agent. Thus, this dissertation highlights the significant potential of reinforcement learning, particularly Q-learning, to enhance robotic navigation efficiency, reduce operational complexity, and optimize logistics processes in dynamic and complex environments. Keywords: path Planning; reinforcement Learning; unmanned Ground Vehicles	en
dc.description.abstract	Esta dissertação investiga a navegação de robôs em ambientes logísticos, com foco em bibliotecas e armazéns, utilizando o método de Q-learning. Para isso, são apresentados três estudos que aplicam aprendizado por reforço visando otimizar o desempenho das tarefas e a eficiência na navegação. O primeiro utiliza Q-learning para aprimorar a organização de livros na biblioteca da Universidade Federal de Viçosa, reduzindo o tempo de planejamento e os movimentos em 20% em comparação a um método guloso, além de alcançar uma taxa de sucesso de 100% na conclusão das tarefas. Já o segundo estudo propõe uma abordagem offline de Q- learning para veículos terrestres não tripulados em armazéns, superando algoritmos tradicionais como Dijkstra, A-star e Busca em Largura, com velocidades de planejamento até sete vezes superiores e uma redução nas curvas de até 41%. Por fim, o terceiro estudo expande o Q-learning para a navegação multiagente em bibliotecas, integrando aprendizado por transferência e aprendizado curricular. Como resultado, as simulações indicaram uma taxa de sucesso de 94% com nove agentes, além de uma redução de 73,36% nas etapas das tarefas em relação a cenários com apenas um agente. Dessa forma, esta dissertação evidencia o potencial significativo do aprendizado por reforço, especialmente do Q-learning, para aumentar a eficiência da navegação robótica, reduzir a complexidade operacional e otimizar processos logísticos em ambientes dinâmicos e complexos. Palavras-chave: planejamento de caminho; aprendizado por reforço; robótica terrestre	pt-BR
dc.description.sponsorship	Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description.sponsorship	Fundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG)
dc.description.sponsorship	Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
dc.identifier.citation	BATISTA, Hiago de Oliveira Braga. Q-learning-based unmanned ground vehicle navigation in warehouse-like environments. 2025. 60 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2025.
dc.identifier.doi	https://doi.org/10.47328/ufvbbt.2025.488
dc.identifier.uri	https://locus.ufv.br/handle/123456789/34825
dc.language.iso	eng
dc.publisher	Universidade Federal de Viçosa
dc.publisher.program	Ciência da Computação	pt-BR
dc.rights	Acesso Aberto
dc.subject	Aprendizado do computador	pt-BR
dc.subject	Robótica	pt-BR
dc.subject	Bibliotecas - Automação	pt-BR
dc.subject	Armazens gerais - Automação	pt-BR
dc.subject.cnpq	Ciência da Computação	pt-BR
dc.title	Q-learning-based unmanned ground vehicle navigation in warehouse-like environments	en
dc.title	Navegação de veículos terrestres não tripulados com base em Q- learning em ambientes semelhantes a armazéns	pt-BR
dc.type	Dissertação

Files

Original bundle

Now showing 1 - 1 of 1

Name:: texto completo.pdf
Size:: 3.2 MB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

Ciência da Computação