Name: | Description: | Size: | Format: | |
---|---|---|---|---|
6.02 MB | Adobe PDF |
Authors
Abstract(s)
This work investigates the usage of deep learning algorithms to perform sentiment analysis
over restaurant reviews from the Zomato application, making use of natural language processing
techniques to handle text data and taking advantage of the rating given by consumers to perform
supervised training. This work presents two models developed from scratch to address the case
study problem using recurrent neural networks and self-attention: Recurrent Encoder Classifier
and Attentive Recurrent Encoder Classifier. These models were subject to two heuristic-based
optimization procedures: a discrete genetic algorithm to select an optimal set of hyperparameters
and optimal architecture and a grid search algorithm to optimize the text preprocessing steps. The
usage of deep learning models with Portuguese data is limited; hence, the gain in performance was
evaluated against classical machine learning models trained on Zomato’s dataset, verifying an
improvement of 3% in F1-score. The genetic algorithm yielded a relative obtainable improvement
score of 4.4% and 8.3% on the recurrent and attentive recurrent encoders architectures,
respectively, against their baseline configuration, with the possibility of further optimization by
increasing the number of generations. The grid search algorithm slightly improved the
performance of each architecture. Both had comparable results, where the Attentive Recurrent
Encoder Classifier presented the best performance with 76% of F1-score, 92.5% of ROC-AUC,
and 82.7% of accuracy. Tests on a Raspberry Pi application to use the model for inference
demonstrated the feasibility of the proposed approach for sentiment analysis in real-world,
resource-constrained environments. The results of the study demonstrate that deep learning
algorithms can effectively analyze sentiment and show superior results to the traditional ML
algorithms and supports the need of exploring smaller, single-task Deep Learning models in the
transition of businesses to solutions based on artificial intelligence.
Esta dissertação investiga a utilização de algoritmos de aprendizagem profunda para realizar análise de sentimentos em avaliações de restaurantes da aplicação Zomato, fazendo uso de técnicas de processamento de linguagem natural para lidar com dados de texto e aproveitando a classificação atribuída pelos consumidores para realizar o treino supervisionado. Este trabalho apresenta dois modelos desenvolvidos de raiz usando redes neurais recorrentes e mecanismos de atenção: Recurrent Encoder Classifier e Attentive Recurrent Encoder Classifier; para abordar o caso de estudo. Estes modelos foram submetidos a dois processos de otimização baseados em heurísticas, um algoritmo genético discreto para selecionar um conjunto ótimo de híper-parâmetros e configurações arquiteturais, e um algoritmo de pesquisa de grade para otimizar as etapas de pré processamento de texto. Dada a limitada utilização de modelos de aprendizagem profunda com dados em português, o seu desempenho foi comparado com modelos clássicos treinados nos dados da Zomato, revelando uma melhoria de 3% no F1. O algoritmo genético resultou num valor da métrica relative obtainable improvement de 4,4% e 8,3% para as arquiteturas com codificadores recursivos e recursivos com atenção, respetivamente, em comparação com suas configurações de referência, com a possibilidade de estender o processo de otimização aumentando o número de gerações. A pesquisa em grade melhorou ligeiramente o desempenho de cada arquitetura. Ambas as arquiteturas apresentaram resultados comparáveis, com a Attentive Recurrent Encoder obtendo o melhor desempenho, com 76% de pontuação F1, 92,5% de ROC-AUC e 82,7% de precisão. Testes numa aplicação com Raspberry Pi utilizando o modelo para inferência demonstraram a viabilidade da abordagem proposta para análise de sentimentos em cenários do mundo real, com recursos limitados. Os resultados indicam que os algoritmos de aprendizagem profunda podem analisar sentimentos de forma eficaz e mostrar resultados superiores aos algoritmos tradicionais, e apoiam a necessidade de explorar modelos de aprendizagem profunda pequenos e de uma única tarefa na transição das empresas para soluções baseadas em inteligência artificial.
Esta dissertação investiga a utilização de algoritmos de aprendizagem profunda para realizar análise de sentimentos em avaliações de restaurantes da aplicação Zomato, fazendo uso de técnicas de processamento de linguagem natural para lidar com dados de texto e aproveitando a classificação atribuída pelos consumidores para realizar o treino supervisionado. Este trabalho apresenta dois modelos desenvolvidos de raiz usando redes neurais recorrentes e mecanismos de atenção: Recurrent Encoder Classifier e Attentive Recurrent Encoder Classifier; para abordar o caso de estudo. Estes modelos foram submetidos a dois processos de otimização baseados em heurísticas, um algoritmo genético discreto para selecionar um conjunto ótimo de híper-parâmetros e configurações arquiteturais, e um algoritmo de pesquisa de grade para otimizar as etapas de pré processamento de texto. Dada a limitada utilização de modelos de aprendizagem profunda com dados em português, o seu desempenho foi comparado com modelos clássicos treinados nos dados da Zomato, revelando uma melhoria de 3% no F1. O algoritmo genético resultou num valor da métrica relative obtainable improvement de 4,4% e 8,3% para as arquiteturas com codificadores recursivos e recursivos com atenção, respetivamente, em comparação com suas configurações de referência, com a possibilidade de estender o processo de otimização aumentando o número de gerações. A pesquisa em grade melhorou ligeiramente o desempenho de cada arquitetura. Ambas as arquiteturas apresentaram resultados comparáveis, com a Attentive Recurrent Encoder obtendo o melhor desempenho, com 76% de pontuação F1, 92,5% de ROC-AUC e 82,7% de precisão. Testes numa aplicação com Raspberry Pi utilizando o modelo para inferência demonstraram a viabilidade da abordagem proposta para análise de sentimentos em cenários do mundo real, com recursos limitados. Os resultados indicam que os algoritmos de aprendizagem profunda podem analisar sentimentos de forma eficaz e mostrar resultados superiores aos algoritmos tradicionais, e apoiam a necessidade de explorar modelos de aprendizagem profunda pequenos e de uma única tarefa na transição das empresas para soluções baseadas em inteligência artificial.
Description
Keywords
Processamento de linguagem natural Análise de sentimentos Língua portuguesa Aprendizagem profunda Algoritmo genético Dispositivo de borda Natural language processing Sentiment analysis Portuguese language Deep learning Genetic algorithm Edge computing Electrical Engineering – Telecommunications . Faculdade de Ciências Exatas e da Engenharia