Identificação de discursos de ódio em redes sociais (2023)
- Authors:
- Autor USP: RODRIGUES, CAROLINE PORFIRIO - ICMC
- Unidade: ICMC
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; APRENDIZADO COMPUTACIONAL; REGRESSÃO LOGÍSTICA
- Keywords: Detecção de discurso de ódio; SVM; Naive Bayes
- Language: Português
- Abstract: A crescente ubiquidade das redes sociais transformou-as em um meio poderoso de expressão, comunicação e compartilhamento de informações em todo o mundo. No entanto, essa disseminação maciça de conteúdo digital também trouxe consigo um desafio crítico: a proliferação de discursos de ódio e conteúdo prejudicial nas plataformas de mídia social. Esses discursos não apenas corroem o ambiente online, mas também têm o potencial de incitar violência, promover a discriminação e prejudicar comunidades inteiras. Portanto, a detecção eficaz de discursos de ódio em redes sociais tornou-se uma questão impera tiva. Este projeto de pesquisa se dedica à detecção de discursos de ódio em tweets em inglês coletados da plataforma Twitter. Foram abordadas técnicas de Processamento de Linguagem Natural (PLN), que inclui normalização de texto, tokenização e vetorização. Também foi implementado o balanceamento de dados usando a técnica Synthetic Minority Over-sampling Technique (SMOTE), gerando amostras sintéticas da classe alvo. A me todologia inclui a aplicação e análise comparativa de três algoritmos de aprendizado de máquina: Support Vector Machine (SVM), Regressão Logística (LR) e Naive Bayes (NB). Essa análise foi conduzida em dois cenários distintos: um com amostras sintéticas (Grupo A) e outro apenas com amostras originais (Grupo B). Dado que o objetivo principal deste estudo é a identificação precisa de discursos de ódio, o recall é uma métrica de avaliação de relevância significativa para os modelos. Os resultados indicaram que o balanceamento de dados no Grupo A resultou em melhorias substanciais no recall para todos os algoritmos, tornando-os mais eficazes na identificação de discursos de ódio. Por outro lado, os modelos no Grupo B demonstraram altas taxas de precisão, mas com recall notavelmente inferior, sugerindo uma tendência a classificar erroneamente muitos exemplos de discursos de ódio comoconteúdo não ofensivo. O algoritmo Naive Bayes registrou resultados superiores em termos de recall, com uma pontuação de 0.88 e uma precisão de 0.4, mas destaca-se também o modelo de Regressão Logística com um recall de 0.6, precisão de 0.68 e F1-score de 0.64, apresentando uma performance mais equilibrada na tarefa de classificação. Este estudo oferece insights para a compreensão da eficácia das abordagens de classificação na detecção de discursos de ódio em mídias sociais e ressalta a importância do balanceamento de dados para aprimorar o desempenho desses modelos.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2023
-
ABNT
RODRIGUES, Caroline Porfirio. Identificação de discursos de ódio em redes sociais. 2023. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2023. Disponível em: https://bdta.abcd.usp.br/directbitstream/4f3e0541-3574-46d0-bba6-4d17ebe36b16/Caroline%20Porfirio%20Rodrigues.pdf. Acesso em: 20 mar. 2025. -
APA
Rodrigues, C. P. (2023). Identificação de discursos de ódio em redes sociais (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/4f3e0541-3574-46d0-bba6-4d17ebe36b16/Caroline%20Porfirio%20Rodrigues.pdf -
NLM
Rodrigues CP. Identificação de discursos de ódio em redes sociais [Internet]. 2023 ;[citado 2025 mar. 20 ] Available from: https://bdta.abcd.usp.br/directbitstream/4f3e0541-3574-46d0-bba6-4d17ebe36b16/Caroline%20Porfirio%20Rodrigues.pdf -
Vancouver
Rodrigues CP. Identificação de discursos de ódio em redes sociais [Internet]. 2023 ;[citado 2025 mar. 20 ] Available from: https://bdta.abcd.usp.br/directbitstream/4f3e0541-3574-46d0-bba6-4d17ebe36b16/Caroline%20Porfirio%20Rodrigues.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Caroline Porfirio Rodrigu... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas