Exportar registro bibliográfico

Geração de sentenças para classificação semissupervisionada de textos (2022)

  • Authors:
  • USP affiliated author: ANDRADE, IVAN CARAMELLO DE - ICMC
  • School: ICMC
  • Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; LINGUAGEM NATURAL; REDES NEURAIS
  • Language: Português
  • Abstract: Em muitos problemas relacionados a classificação automatizada de textos, a obtenção de grandes quantidades de exemplos rotulados é custosa ou impraticável, mesmo quando há um número significativo de exemplos disponíveis para treinamento. No entanto, com o avanço recente na área de modelos computacionais capazes de compreender e gerar linguagem natural, é possível utilizar esses modelos para a geração de dados sintéticos baseados tanto em dados rotulados como não-rotulados, permitindo que modelos mais robustos de classificação sejam treinados de maneria semissupervisionada. Enquanto técnicas mais rudimentares de geração de dados sintéticos se baseavam na permutação ou remoção aleatória de caracteres e palavras, modelos linguísticos modernos utilizam o contexto de uma sentença para aumentar o conjunto de dados de maneira mais realista. Técnicas baseadas em redes neurais com transformers, como a BERT, conseguem propor palavras que melhor preencheriam uma lacuna numa sentença, baseada no contexto como um todo, o que leva a textos sintéticos que mantém o valor semântico e o rótulo dos textos originais. Neste trabalho, algumas técnicas para aumento de dados através da geração sintética de exemplos rotulados foram exploradas, levando a resultados promissores sobre suas aplicações em domínios com grande restrição na disponibilidade de exemplos rotulados.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada Ivan Caramello de Andrade... Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      ANDRADE, Ivan Caramello de. Geração de sentenças para classificação semissupervisionada de textos. 2022. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2022. Disponível em: https://bdta.abcd.usp.br/directbitstream/e1c53bc3-47ec-43db-88b8-9679bd162942/Ivan%20Caramello%20de%20Andrade_tcc_revisao_2022_09_07_207225.pdf. Acesso em: 28 mar. 2024.
    • APA

      Andrade, I. C. de. (2022). Geração de sentenças para classificação semissupervisionada de textos (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/e1c53bc3-47ec-43db-88b8-9679bd162942/Ivan%20Caramello%20de%20Andrade_tcc_revisao_2022_09_07_207225.pdf
    • NLM

      Andrade IC de. Geração de sentenças para classificação semissupervisionada de textos [Internet]. 2022 ;[citado 2024 mar. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/e1c53bc3-47ec-43db-88b8-9679bd162942/Ivan%20Caramello%20de%20Andrade_tcc_revisao_2022_09_07_207225.pdf
    • Vancouver

      Andrade IC de. Geração de sentenças para classificação semissupervisionada de textos [Internet]. 2022 ;[citado 2024 mar. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/e1c53bc3-47ec-43db-88b8-9679bd162942/Ivan%20Caramello%20de%20Andrade_tcc_revisao_2022_09_07_207225.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Digital Library of Academic Works of Universidade de São Paulo     2012 - 2024