Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Universidade Federal de Viçosa
Abstract
A anotação semântica permite que pessoas e dispositivos computacionais entendam mais facilmente o significado de uma sentença expressa em linguagem natural. Classificar textos de acordo com seu conteúdo é frequentemente uma das primeiras etapas realizadas por aplicativos voltados para o processamento de linguagem natural. E, apesar de ser um princípio básico, este passo é feito, geralmente, de forma manual, o que faz com que o processo seja lento, custoso e limitado. Para que a anotação seja realizada automaticamente, os métodos devem ser bem definidos por meio de um conjunto de características ou features, elaborado por especialistas, a fim de que o sistema possa atribuir probabilidades e fazer inferências. Nesta dissertação é apresentado um modelo de rede recorrente profunda que anota semanticamente textos escritos em inglês, e manipula como rótulo categorias de uma ontologia de nível topo. Os testes mostraram que é possível obter melhores resultados do que os encontrados em modelos que precisam do fornecimento prévio de features. Palavras-chave: PLN. Anotação Semântica. Rede Neural Recorrente. LSTM. Ontologia.
Semantic labeling of texts allows people and computing devices to more easily understand the meaning of a natural language sentence as a whole. Semantic annotation is often one of the first steps carried out by applications focused on natural language processing. However, this step is often done manually, which is very expensive and time-consuming. When automatic methods are employed, they require that a set of features, elaborated by specialists, be provided so that the system can assign probabilities in order to make inferences. In this thesis we present a model of the deep recurrent network that semantically annotates texts in English using as labels the top categories of an ontology. The tests showed that it is possible to obtain better results than the models that need the features to be made explicit. Keywords: NLP. Semantic Annotation. Recurrent Network. LSTM. Ontology.
Semantic labeling of texts allows people and computing devices to more easily understand the meaning of a natural language sentence as a whole. Semantic annotation is often one of the first steps carried out by applications focused on natural language processing. However, this step is often done manually, which is very expensive and time-consuming. When automatic methods are employed, they require that a set of features, elaborated by specialists, be provided so that the system can assign probabilities in order to make inferences. In this thesis we present a model of the deep recurrent network that semantically annotates texts in English using as labels the top categories of an ontology. The tests showed that it is possible to obtain better results than the models that need the features to be made explicit. Keywords: NLP. Semantic Annotation. Recurrent Network. LSTM. Ontology.
Description
Citation
SILVA, Roberta Caroline Rodrigues. Anotação semântica automática por meio de redes neurais profundas para corpora na língua inglesa. 2019. 66 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Viçosa, Viçosa. 2019.
