Mineração de texto aplicada à detecção de cyberbullying

Bomfim, Tácio Souza; Lopes, Alneu de Andrade

Mineração de texto aplicada à detecção de cyberbullying (2022)

Authors:
- Bomfim, Tácio Souza
- Lopes, Alneu de Andrade (Orientador)
Autor USP: BOMFIM, TACIO SOUZA - ICMC
Unidade: ICMC
Subjects: INTELIGÊNCIA ARTIFICIAL; MINERAÇÃO DE DADOS; APRENDIZADO COMPUTACIONAL
Language: Português
Abstract: O Cyberbullying é considerado como um grave problema de saúde pública pelo centro de controle e prevenção de doenças e têm crescido ao passar dos anos, principalmente entre as crianças e adolescentes, auxiliado pelo aumento e difusão das redes sociais. Os tipos de ofensa do cyberbullying podem ter cunhos racista, homofóbicos, sexistas, ou estar ligado a depreciação do indivíduo, através de discursos de ódio, e é considerado como crime, estando associadas àqueles crimes previstos no decreto-lei no 2.848, de 7 de dezembro de 1940, do código penal brasileiro, como calúnia, difamação, injúria, ameaça e constrangimento ilegal, podendo ainda a pena ser agravada em caso de ser realizado pela Internet. Como forma de auxiliar a mitigar o cyberbullying em meios digitais, tais como Twitter, Facebook e Instagram, o objetivo deste trabalho foi treinar algoritmos de mineração de texto existentes, com capacidade de identificar mensagens de ofensa relacionadas ao cyberbullying, realizando comparação entre eles. Dessa maneira, foram utilizados dois algoritmos para a tarefa de classificação de textos, o BERT e o One Class SVM. O treinamento ocorreu utilizando duas bases de dados com tweets em língua portuguesa. Como resultado, o modelo BERT com a utilização do BERTimbau, que é o modelo pré treinado para língua portuguesa, obteve um F1-Score total de 80% para a primeira base, com uma precisão e revocação também de 80%. O One Class SVM, obteve um F1-Score global de 61%, com uma precisão de 67%. Com a segunda base de textos, foi encontrado um resultado de F1-Score de 67% para o BERT e 48% para o outro modelo. Outra conclusão que ficou evidente na aplicação deste trabalho foi a dificuldade de os modelos identificarem textos com sentido figurado, sarcasmo ou ironia. Dessa forma, como trabalhos futuros, é identificado a necessidade de treinar outros algoritmos que possam ter desempenho melhores na classificação, principalmente aquelesque trarão uma boa compreensão semântica para classificar exemplos complexos. Uma outra tarefa é melhorar a base de dados de treinamento, com aplicação de modelos de pré-processamento mais robustos e cuidadosos, a fim de verificar se o desempenho do modelo aumenta nessa situação.
Imprenta:
- Publisher place: São Carlos
- Date published: 2022

Download do texto completo

Tipo	Nome	Link
	Tacio Souza Bomfim.pdf	Direct link

How to cite

A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

ABNT

BOMFIM, Tácio Souza. Mineração de texto aplicada à detecção de cyberbullying. 2022. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2022. Disponível em: https://bdta.abcd.usp.br/directbitstream/2a962759-29b7-480c-97a4-78c217d2ad19/Tacio%20Souza%20Bomfim.pdf. Acesso em: 28 fev. 2026.
APA

Bomfim, T. S. (2022). Mineração de texto aplicada à detecção de cyberbullying (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/2a962759-29b7-480c-97a4-78c217d2ad19/Tacio%20Souza%20Bomfim.pdf
NLM

Bomfim TS. Mineração de texto aplicada à detecção de cyberbullying [Internet]. 2022 ;[citado 2026 fev. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/2a962759-29b7-480c-97a4-78c217d2ad19/Tacio%20Souza%20Bomfim.pdf
Vancouver

Bomfim TS. Mineração de texto aplicada à detecção de cyberbullying [Internet]. 2022 ;[citado 2026 fev. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/2a962759-29b7-480c-97a4-78c217d2ad19/Tacio%20Souza%20Bomfim.pdf

BDTA

Exportar registro bibliográfico

Mineração de texto aplicada à detecção de cyberbullying (2022)

Download do texto completo

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

USP Schools

BDTA

Exportar registro bibliográfico

Mineração de texto aplicada à detecção de cyberbullying (2022)

Download do texto completo

How to cite

Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI: