Uma Análise de Large Language Models para a Rotulação de Polaridade de Revisões de Produtos Escritas em Português (2024)
- Authors:
- Autor USP: CUNHA, NATÁLIA SATHLER DE SOUZA - ICMC
- Unidade: ICMC
- Subjects: APRENDIZADO COMPUTACIONAL; COMÉRCIO ELETRÔNICO; PROCESSAMENTO DE LINGUAGEM NATURAL; QUALIDADE DE PRODUTOS AO CONSUMIDOR; SATISFAÇÃO DO CONSUMIDOR; REDES SOCIAIS
- Keywords: Análise de Sentimentos; LLMs; GPT; Gemini
- Language: Português
- Abstract: As compras online estão se tornando cada vez mais comum entre os brasileiros. Essa tendência é impulsionada pela popularização do varejo digital e a maior conectividade da sociedade. No entanto, desafios como entregas atrasadas, produtos danificados e a insegurança dos consumidores em não ver o produto pessoalmente ainda persistem. Diante desses problemas, as revisões de produtos (reviews) surgem como uma ferramenta essencial, oferecendo relatos de experiências dos consumidores. Os relatos não apenas ajudam os consumidores, mas também fornecem insights valiosos para fabricantes e vendedores, possibilitando melhorias e aumentando a relevância da marca. A mineração de opiniões ou análise de sentimentos busca estudar as emoções e opiniões em relação a produtos e serviços, e gerar insights relevantes para tomadores de decisão. A análise de sentimentos é mais acurada ao se utilizar técnicas de aprendizado de máquina supervisionadas, o que exige uma rotulação muitas vezes de uma grande quantidade de revisões, as quais geralmente sáo feitas de forma manual. Porém, a rotulação manual pode ser demorada e propensa a erros. O uso de Large Language Models (LLMs) tem se mostrado promissor nesse contexto, proporcionando uma abordagem mais eficiente na rotulação automática. Contudo, a eficácia desses modelos ainda é um tema de investigação. Dado isso, o objetivo deste trabalho é avaliar a performance dos LLMs na rotulação de reviews, buscando identificar se é possível alcançar resultados comparáveis à rotulação humana sem ajustes específicos nos modelos. Os resultados mostram que tanto o GPT-4o-mini quanto o Gemini- 1.5-Flash apresentaram acurácias semelhantes, com 79% e 80%, respectivamente, indicando que os modelos podem efetivamente ajudar na análise de sentimentos em português. Tais resultados poderiam ser melhores evitando os erros de rotulação na base de referência, o quais fizeram com que a performancereal desses modelos fossem menor.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
-
ABNT
CUNHA, Natália Sathler de Souza. Uma Análise de Large Language Models para a Rotulação de Polaridade de Revisões de Produtos Escritas em Português. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/a6418a20-2fef-4adb-ae9f-6b1d4fa71961/Nat%C3%A1lia_Sathler_de_Souza_Cunha.pdf. Acesso em: 28 abr. 2025. -
APA
Cunha, N. S. de S. (2024). Uma Análise de Large Language Models para a Rotulação de Polaridade de Revisões de Produtos Escritas em Português (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/a6418a20-2fef-4adb-ae9f-6b1d4fa71961/Nat%C3%A1lia_Sathler_de_Souza_Cunha.pdf -
NLM
Cunha NS de S. Uma Análise de Large Language Models para a Rotulação de Polaridade de Revisões de Produtos Escritas em Português [Internet]. 2024 ;[citado 2025 abr. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/a6418a20-2fef-4adb-ae9f-6b1d4fa71961/Nat%C3%A1lia_Sathler_de_Souza_Cunha.pdf -
Vancouver
Cunha NS de S. Uma Análise de Large Language Models para a Rotulação de Polaridade de Revisões de Produtos Escritas em Português [Internet]. 2024 ;[citado 2025 abr. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/a6418a20-2fef-4adb-ae9f-6b1d4fa71961/Nat%C3%A1lia_Sathler_de_Souza_Cunha.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Natália_Sathler_de_Souza... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas