Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto (2024)
- Authors:
- Autor USP: PEREIRA JÚNIOR, VINÍTIUS SALOMÃO - ICMC
- Unidade: ICMC
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; ROBUSTEZ; AUTOR
- Keywords: Atribuição de autoria; Ruídos textuais
- Language: Português
- Abstract: Este estudo tem como objetivo investigar a robustez de métodos de atribuição de autoria em cenários adversos, utilizando modelos de processamento de linguagem natural (PLN) sob diferentes condições de ruído textual. A pesquisa se concentra na análise de dois métodos distintos: Support Vector Machines (SVM), um classificador supervisionado que utiliza hiperplanos para separar as classes autorais, e o modelo probabilístico Prediction by Partial Matching (PPM), que realiza compressão de sequências textuais para modelar a probabilidade de ocorrência de padrões linguísticos. Para a validação dos modelos, utilizou-se um corpus composto por fanfictions em língua inglesa extraídas da competição PAN-2019, organizado em cinco problemas distintos. Esse gênero textual foi escolhido por sua natureza transformativa e pela variabilidade estilística inerente, características que tornam a tarefa de identificação autoral mais complexa. Foram aplicados cinco tipos de ruídos aos textos: abreviações, erros ortográficos, erros contextuais, gírias e "internetês", distribuídos em três níveis de intensidade (10%, 30% e 50% das palavras alteradas), com o intuito de avaliar o impacto progressivo de cada distorção sobre a performance dos classificadores. Os resultados indicaram que, embora ambos os métodos sofram degradação de desempenho com o aumento dos ruídos, o PPM demonstrou maior resiliência em cenários de intensidade moderada, devido à sua abordagem probabilística que considera padrões sequenciais do texto. Por outro lado, o SVM, mais dependente de características lexicais fixas, apresentou maior suscetibilidade às distorções, especialmente em níveis elevados de ruído. A análise comparativa, com base em métricas como F1-score e acurácia, evidenciou que o PPM é mais eficaz em capturar nuances estilísticas em cenários adversos, enquanto o SVM destacou-se em situações com menor variabilidade linguística. O estudo conclque a integração de abordagens híbridas pode mitigar as limitações observadas em ambos os modelos, unindo a discriminação estilística do SVM com a robustez contextual do PPM. Além disso, ressalta-se a necessidade de pesquisas futuras que explorem modelos mais avançados, como redes neurais profundas, e incorporem gêneros textuais variados para avaliar a aplicabilidade desses métodos em diferentes contextos.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
-
ABNT
PEREIRA JÚNIOR, Vinítius Salomão. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/a5757834-a854-412f-896b-07195c63e0e6/Vinitius_Salomao.pdf. Acesso em: 23 mar. 2025. -
APA
Pereira Júnior, V. S. (2024). Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/a5757834-a854-412f-896b-07195c63e0e6/Vinitius_Salomao.pdf -
NLM
Pereira Júnior VS. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto [Internet]. 2024 ;[citado 2025 mar. 23 ] Available from: https://bdta.abcd.usp.br/directbitstream/a5757834-a854-412f-896b-07195c63e0e6/Vinitius_Salomao.pdf -
Vancouver
Pereira Júnior VS. Robustez de Modelos de Atribuição de Autoria: Uma Análise em Cenários de Ruído Textual e Conjunto Aberto [Internet]. 2024 ;[citado 2025 mar. 23 ] Available from: https://bdta.abcd.usp.br/directbitstream/a5757834-a854-412f-896b-07195c63e0e6/Vinitius_Salomao.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Vinitius_Salomao.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas