Exportar registro bibliográfico

Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto (2024)

  • Authors:
  • Autor USP: PEREIRA JÚNIOR, VINÍTIUS SALOMÃO - ICMC
  • Unidade: ICMC
  • Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; ROBUSTEZ; AUTOR
  • Keywords: Atribuição de autoria; Ruídos textuais
  • Language: Português
  • Abstract: Este estudo tem como objetivo investigar a robustez de métodos de atribuição de autoria em cenários adversos, utilizando modelos de processamento de linguagem natural (PLN) sob diferentes condições de ruído textual. A pesquisa se concentra na análise de dois métodos distintos: Support Vector Machines (SVM), um classificador supervisionado que utiliza hiperplanos para separar as classes autorais, e o modelo probabilístico Prediction by Partial Matching (PPM), que realiza compressão de sequências textuais para modelar a probabilidade de ocorrência de padrões linguísticos. Para a validação dos modelos, utilizou-se um corpus composto por fanfictions em língua inglesa extraídas da competição PAN-2019, organizado em cinco problemas distintos. Esse gênero textual foi escolhido por sua natureza transformativa e pela variabilidade estilística inerente, características que tornam a tarefa de identificação autoral mais complexa. Foram aplicados cinco tipos de ruídos aos textos: abreviações, erros ortográficos, erros contextuais, gírias e "internetês", distribuídos em três níveis de intensidade (10%, 30% e 50% das palavras alteradas), com o intuito de avaliar o impacto progressivo de cada distorção sobre a performance dos classificadores. Os resultados indicaram que, embora ambos os métodos sofram degradação de desempenho com o aumento dos ruídos, o PPM demonstrou maior resiliência em cenários de intensidade moderada, devido à sua abordagem probabilística que considera padrões sequenciais do texto. Por outro lado, o SVM, mais dependente de características lexicais fixas, apresentou maior suscetibilidade às distorções, especialmente em níveis elevados de ruído. A análise comparativa, com base em métricas como F1-score e acurácia, evidenciou que o PPM é mais eficaz em capturar nuances estilísticas em cenários adversos, enquanto o SVM destacou-se em situações com menor variabilidade linguística. O estudo conclque a integração de abordagens híbridas pode mitigar as limitações observadas em ambos os modelos, unindo a discriminação estilística do SVM com a robustez contextual do PPM. Além disso, ressalta-se a necessidade de pesquisas futuras que explorem modelos mais avançados, como redes neurais profundas, e incorporem gêneros textuais variados para avaliar a aplicabilidade desses métodos em diferentes contextos.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada Vinitius_Salomao.pdf Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      PEREIRA JÚNIOR, Vinítius Salomão. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/a5757834-a854-412f-896b-07195c63e0e6/Vinitius_Salomao.pdf. Acesso em: 23 mar. 2025.
    • APA

      Pereira Júnior, V. S. (2024). Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/a5757834-a854-412f-896b-07195c63e0e6/Vinitius_Salomao.pdf
    • NLM

      Pereira Júnior VS. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto [Internet]. 2024 ;[citado 2025 mar. 23 ] Available from: https://bdta.abcd.usp.br/directbitstream/a5757834-a854-412f-896b-07195c63e0e6/Vinitius_Salomao.pdf
    • Vancouver

      Pereira Júnior VS. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto [Internet]. 2024 ;[citado 2025 mar. 23 ] Available from: https://bdta.abcd.usp.br/directbitstream/a5757834-a854-412f-896b-07195c63e0e6/Vinitius_Salomao.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Biblioteca Digital de Trabalhos Acadêmicos da Universidade de São Paulo     2012 - 2025