CarmenGen: um modelo de linguagem para geração de poemas

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Universidade Federal de Viçosa

Abstract

A geração automática de textos pela Inteligência Artificial (IA) tem avançado significativamente nas últimas décadas, com modelos capazes de produzir descrições, respostas e narrativas coerentes em diversos contextos. No entanto, a linguagem humana, com sua complexidade estrutural, riqueza semântica e sutileza estilística, permanece como um campo de estudo extremamente desafiador dentro do Processamento de Linguagem Natural. Entre as tarefas mais complexas, a geração automática de poemas ocupa posição singular, sendo reconhecida como uma das poucas tarefas em que os modelos de IA ainda não alcançaram resultados plenamente satisfatórios, sobretudo no que se refere à preservação rigorosa de aspectos formais como a metrificação e a rima. Este trabalho propõe uma abordagem inovadora para enfrentar esse desafio, resultando no desenvolvimento do CarmenGen, um modelo de linguagem baseado em arquiteturas de redes neurais profundas capaz de gerar poemas que atendem a requisitos de forma. Para avaliar objetivamente os textos gerados, foi criada a métrica CARMEN, projetada para medir a conformidade com estruturas métricas e padrões de rima. Adicionalmente, foi construído o Carmen Corpus, um conjunto de poemas anotados e cuidadosamente selecionados para treinamento e avaliação do modelo, servindo como recurso valioso para futuras pesquisas na área. Os resultados obtidos demonstram que o CarmenGen atingiu desempenho médio de 91% na métrica CARMEN, cumprindo integralmente os requisitos em 95% dos casos, superando modelos de referência e estabelecendo um novo patamar para a geração automática de poemas. As contribuições deste trabalho incluem não apenas o avanço técnico na modelagem de textos poéticos, mas também o fornecimento de ferramentas de avaliação especializadas e de um corpus de alta qualidade. Essas contribuições ampliam as possibilidades de aplicação da IA em contextos criativos e reforçam a relevância do estudo da geração de linguagem natural como uma das áreas mais desafiadoras e promissoras da inteligência artificial contemporânea. Palavras-chave: inteligência artificial; processamento de linguagem natural; modelo de linguagem; aprendizado profundo; geração automática de poemas
Automatic text generation by Artificial Intelligence (AI) has advanced significantly in recent decades, with models capable of producing coherent descriptions, responses, and narratives in diverse contexts. However, human language, with its structural complexity, semantic richness, and stylistic subtlety, remains an extremely challenging field of study within Natural Language Processing. Among the most complex tasks, automatic poem generation occupies a unique position, recognized as one of the few tasks in which AI models have not yet achieved fully satisfactory results, especially regarding the rigorous preservation of formal aspects such as metrication and rhyme. This work proposes an innovative approach to address this challenge, resulting in the development of CarmenGen, a language model based on deep neural network architectures capable of generating poems that meet formal requirements. To objectively evaluate the generated texts, the CARMEN metric was created, designed to measure compliance with metrical structures and rhyme patterns. Additionally, the Carmen Corpus was constructed, a set of annotated poems carefully selected for training and evaluating the model, serving as a valuable resource for future research in the field. The results demonstrate that CarmenGen achieved an average performance of 91% on the CARMEN metric, fully meeting the requirements in 95% of cases, outperforming reference models and establishing a new standard for automatic poem generation. The contributions of this work include not only technical advancement in poetic text modeling but also the provision of specialized evaluation tools and a high-quality corpus. These contributions expand the possibilities for applying AI in creative contexts and reinforce the relevance of studying natural language generation as one of the most challenging and promising areas of contemporary artificial intelligence. Keywords: artificial intelligence; natural language processing; language model; deep learning; automatic poem generation

Description

Citation

POSSI, Maurilio de Araujo. CarmenGen: um modelo de linguagem para geração de poemas. 2024. 82 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2024.

Endorsement

Review

Supplemented By

Referenced By