Geração de sentenças para classificação semissupervisionada de textos (2022)
- Authors:
- Autor USP: ANDRADE, IVAN CARAMELLO DE - ICMC
- Unidade: ICMC
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; LINGUAGEM NATURAL; REDES NEURAIS
- Language: Português
- Abstract: Em muitos problemas relacionados a classificação automatizada de textos, a obtenção de grandes quantidades de exemplos rotulados é custosa ou impraticável, mesmo quando há um número significativo de exemplos disponíveis para treinamento. No entanto, com o avanço recente na área de modelos computacionais capazes de compreender e gerar linguagem natural, é possível utilizar esses modelos para a geração de dados sintéticos baseados tanto em dados rotulados como não-rotulados, permitindo que modelos mais robustos de classificação sejam treinados de maneria semissupervisionada. Enquanto técnicas mais rudimentares de geração de dados sintéticos se baseavam na permutação ou remoção aleatória de caracteres e palavras, modelos linguísticos modernos utilizam o contexto de uma sentença para aumentar o conjunto de dados de maneira mais realista. Técnicas baseadas em redes neurais com transformers, como a BERT, conseguem propor palavras que melhor preencheriam uma lacuna numa sentença, baseada no contexto como um todo, o que leva a textos sintéticos que mantém o valor semântico e o rótulo dos textos originais. Neste trabalho, algumas técnicas para aumento de dados através da geração sintética de exemplos rotulados foram exploradas, levando a resultados promissores sobre suas aplicações em domínios com grande restrição na disponibilidade de exemplos rotulados.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2022
-
ABNT
ANDRADE, Ivan Caramello de. Geração de sentenças para classificação semissupervisionada de textos. 2022. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2022. Disponível em: https://bdta.abcd.usp.br/directbitstream/e1c53bc3-47ec-43db-88b8-9679bd162942/Ivan%20Caramello%20de%20Andrade_tcc_revisao_2022_09_07_207225.pdf. Acesso em: 16 mar. 2025. -
APA
Andrade, I. C. de. (2022). Geração de sentenças para classificação semissupervisionada de textos (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/e1c53bc3-47ec-43db-88b8-9679bd162942/Ivan%20Caramello%20de%20Andrade_tcc_revisao_2022_09_07_207225.pdf -
NLM
Andrade IC de. Geração de sentenças para classificação semissupervisionada de textos [Internet]. 2022 ;[citado 2025 mar. 16 ] Available from: https://bdta.abcd.usp.br/directbitstream/e1c53bc3-47ec-43db-88b8-9679bd162942/Ivan%20Caramello%20de%20Andrade_tcc_revisao_2022_09_07_207225.pdf -
Vancouver
Andrade IC de. Geração de sentenças para classificação semissupervisionada de textos [Internet]. 2022 ;[citado 2025 mar. 16 ] Available from: https://bdta.abcd.usp.br/directbitstream/e1c53bc3-47ec-43db-88b8-9679bd162942/Ivan%20Caramello%20de%20Andrade_tcc_revisao_2022_09_07_207225.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Ivan Caramello de Andrade... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas