Exportar registro bibliográfico


Metrics:

Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto (2024)

  • Authors:
  • Autor USP: PEREIRA JÚNIOR, VINÍTIUS SALOMÃO - ICMC
  • Unidade: ICMC
  • DOI: 10.11606/003224647
  • Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; ROBUSTEZ; AUTOR
  • Keywords: Atribuição de autoria; Ruídos textuais
  • Language: Português
  • Abstract: Este estudo tem como objetivo investigar a robustez de métodos de atribuição de autoria em cenários adversos, utilizando modelos de processamento de linguagem natural (PLN) sob diferentes condições de ruído textual. A pesquisa se concentra na análise de dois métodos distintos: Support Vector Machines (SVM), um classificador supervisionado que utiliza hiperplanos para separar as classes autorais, e o modelo probabilístico Prediction by Partial Matching (PPM), que realiza compressão de sequências textuais para modelar a probabilidade de ocorrência de padrões linguísticos. Para a validação dos modelos, utilizou-se um corpus composto por fanfictions em língua inglesa extraídas da competição PAN-2019, organizado em cinco problemas distintos. Esse gênero textual foi escolhido por sua natureza transformativa e pela variabilidade estilística inerente, características que tornam a tarefa de identificação autoral mais complexa. Foram aplicados cinco tipos de ruídos aos textos: abreviações, erros ortográficos, erros contextuais, gírias e "internetês", distribuídos em três níveis de intensidade (10%, 30% e 50% das palavras alteradas), com o intuito de avaliar o impacto progressivo de cada distorção sobre a performance dos classificadores. Os resultados indicaram que, embora ambos os métodos sofram degradação de desempenho com o aumento dos ruídos, o PPM demonstrou maior resiliência em cenários de intensidade moderada, devido à sua abordagem probabilística que considera padrões sequenciais do texto. Por outro lado, o SVM, mais dependente de características lexicais fixas, apresentou maior suscetibilidade às distorções, especialmente em níveis elevados de ruído. A análise comparativa, com base em métricas como F1-score e acurácia, evidenciou que o PPM é mais eficaz em capturar nuances estilísticas em cenários adversos, enquanto o SVM destacou-se em situações com menor variabilidade linguística. O estudo conclque a integração de abordagens híbridas pode mitigar as limitações observadas em ambos os modelos, unindo a discriminação estilística do SVM com a robustez contextual do PPM. Além disso, ressalta-se a necessidade de pesquisas futuras que explorem modelos mais avançados, como redes neurais profundas, e incorporem gêneros textuais variados para avaliar a aplicabilidade desses métodos em diferentes contextos.
  • Imprenta:
  • Versão PublicadaAcesso à fonteDOI
    Informações sobre o DOI: 10.11606/003224647 (Fonte: oaDOI API)
    • Este periódico é de acesso aberto
    • Este artigo é de acesso aberto
    • URL de acesso aberto
    • Cor do Acesso Aberto: gold
    • Licença: cc-by-nc-sa

    Download do texto completo

    Tipo Nome Link
    Versão Publicada Vinitius_Salomao.pdf Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      PEREIRA JÚNIOR, Vinítius Salomão. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://doi.org/10.11606/003224647. Acesso em: 01 jan. 2026.
    • APA

      Pereira Júnior, V. S. (2024). Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://doi.org/10.11606/003224647
    • NLM

      Pereira Júnior VS. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto [Internet]. 2024 ;[citado 2026 jan. 01 ] Available from: https://doi.org/10.11606/003224647
    • Vancouver

      Pereira Júnior VS. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto [Internet]. 2024 ;[citado 2026 jan. 01 ] Available from: https://doi.org/10.11606/003224647

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Biblioteca Digital de Trabalhos Acadêmicos da Universidade de São Paulo     2012 - 2026