Exportar registro bibliográfico

Mineração de texto aplicada à detecção de cyberbullying (2022)

  • Authors:
  • USP affiliated author: BOMFIM, TACIO SOUZA - ICMC
  • School: ICMC
  • Subjects: INTELIGÊNCIA ARTIFICIAL; MINERAÇÃO DE DADOS; APRENDIZADO COMPUTACIONAL
  • Language: Português
  • Abstract: O Cyberbullying é considerado como um grave problema de saúde pública pelo centro de controle e prevenção de doenças e têm crescido ao passar dos anos, principalmente entre as crianças e adolescentes, auxiliado pelo aumento e difusão das redes sociais. Os tipos de ofensa do cyberbullying podem ter cunhos racista, homofóbicos, sexistas, ou estar ligado a depreciação do indivíduo, através de discursos de ódio, e é considerado como crime, estando associadas àqueles crimes previstos no decreto-lei no 2.848, de 7 de dezembro de 1940, do código penal brasileiro, como calúnia, difamação, injúria, ameaça e constrangimento ilegal, podendo ainda a pena ser agravada em caso de ser realizado pela Internet. Como forma de auxiliar a mitigar o cyberbullying em meios digitais, tais como Twitter, Facebook e Instagram, o objetivo deste trabalho foi treinar algoritmos de mineração de texto existentes, com capacidade de identificar mensagens de ofensa relacionadas ao cyberbullying, realizando comparação entre eles. Dessa maneira, foram utilizados dois algoritmos para a tarefa de classificação de textos, o BERT e o One Class SVM. O treinamento ocorreu utilizando duas bases de dados com tweets em língua portuguesa. Como resultado, o modelo BERT com a utilização do BERTimbau, que é o modelo pré treinado para língua portuguesa, obteve um F1-Score total de 80% para a primeira base, com uma precisão e revocação também de 80%. O One Class SVM, obteve um F1-Score global de 61%, com uma precisão de 67%. Com a segunda base de textos, foi encontrado um resultado de F1-Score de 67% para o BERT e 48% para o outro modelo. Outra conclusão que ficou evidente na aplicação deste trabalho foi a dificuldade de os modelos identificarem textos com sentido figurado, sarcasmo ou ironia. Dessa forma, como trabalhos futuros, é identificado a necessidade de treinar outros algoritmos que possam ter desempenho melhores na classificação, principalmente aquelesque trarão uma boa compreensão semântica para classificar exemplos complexos. Uma outra tarefa é melhorar a base de dados de treinamento, com aplicação de modelos de pré-processamento mais robustos e cuidadosos, a fim de verificar se o desempenho do modelo aumenta nessa situação.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada Tacio Souza Bomfim.pdf Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BOMFIM, Tácio Souza. Mineração de texto aplicada à detecção de cyberbullying. 2022. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2022. Disponível em: https://bdta.abcd.usp.br/directbitstream/2a962759-29b7-480c-97a4-78c217d2ad19/Tacio%20Souza%20Bomfim.pdf. Acesso em: 19 abr. 2024.
    • APA

      Bomfim, T. S. (2022). Mineração de texto aplicada à detecção de cyberbullying (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/2a962759-29b7-480c-97a4-78c217d2ad19/Tacio%20Souza%20Bomfim.pdf
    • NLM

      Bomfim TS. Mineração de texto aplicada à detecção de cyberbullying [Internet]. 2022 ;[citado 2024 abr. 19 ] Available from: https://bdta.abcd.usp.br/directbitstream/2a962759-29b7-480c-97a4-78c217d2ad19/Tacio%20Souza%20Bomfim.pdf
    • Vancouver

      Bomfim TS. Mineração de texto aplicada à detecção de cyberbullying [Internet]. 2022 ;[citado 2024 abr. 19 ] Available from: https://bdta.abcd.usp.br/directbitstream/2a962759-29b7-480c-97a4-78c217d2ad19/Tacio%20Souza%20Bomfim.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Academic Works of Universidade de São Paulo     2012 - 2024