Exportar registro bibliográfico

Sumarização de documentos do arcabouço regulatório financeiro brasileiro (2024)

  • Authors:
  • Autor USP: BENVEGMI, GABRIEL - EP
  • Unidade: EP
  • Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; APRENDIZADO COMPUTACIONAL; MERCADO FINANCEIRO
  • Language: Português
  • Abstract: Este trabalho analisa criticamente o uso de alguns modelos de linguagem grandes (LLMs) para o caso particular de sumarização automática de documentos do arcabouço regulatório financeiro brasileiro, em especial os ofícios e comunicados publicados pela B3, a bolsa de valores brasileira. Um conjunto de dados padrão ouro foi compilado, anotado e revisado especificamente para este trabalho a partir de documentos publicamente disponíveis no endereço eletrônico da B3, o que contemplou, no processo, a criação de sumários de referência por avaliadores humanos. A abordagem de sumarização empregada foi a abstrativa, implementada por meio da adoção e comparação de diferentes modelos de linguagem, sendo eles: Bode 7B, PTT5 Base e o mais recentemente publicado Mistral 7B. Os documentos originais do conjunto de dados de validação continham, em média, aproximadamente 198 tokens e, através da sumarização, foram reduzidos para uma média de 129 tokens pelo modelo Mistral, e 93 tokens pelo PTT5, respectivamente. Na avaliação dos resultados, o Mistral superou os demais, com um ROUGE de aproximadamente 0,81 nos dados de validação, contra 0,61 do segundo colocado, o PTT5, que, ainda assim, exige uma menor quantidade de recursos computacionais para seu ajuste fino e geração textual que o primeiro, sendo possivelmente um caso de bom custo-benefício. Possibilidades futuras são também consideradas com base nos resultados como, por exemplo, fazer uma análise utilizando a abordagem de sumarização híbrida – que contempla o uso combinado de abordagens extrativa e abstrativa –, ou mesmo de continuar o ajuste fino dos modelos usados com outras entidades do meio regulatório financeiro brasileiro.
  • Imprenta:
  • Versão PublicadaAcesso à fonte

    Download do texto completo

    Tipo Nome Link
    Versão Publicada Gabriel_Benvegmi.pdf Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      BENVEGMI, Gabriel. Sumarização de documentos do arcabouço regulatório financeiro brasileiro. 2024. Trabalho de Conclusão de Curso (Especialização) – Escola Politécnica, Universidade de São Paulo, São Paulo, 2024. Disponível em: https://pecepoli.com.br/m_files/00096240_000490_monografia01.pdf. Acesso em: 24 mar. 2025.
    • APA

      Benvegmi, G. (2024). Sumarização de documentos do arcabouço regulatório financeiro brasileiro (Trabalho de Conclusão de Curso (Especialização). Escola Politécnica, Universidade de São Paulo, São Paulo. Recuperado de https://pecepoli.com.br/m_files/00096240_000490_monografia01.pdf
    • NLM

      Benvegmi G. Sumarização de documentos do arcabouço regulatório financeiro brasileiro [Internet]. 2024 ;[citado 2025 mar. 24 ] Available from: https://pecepoli.com.br/m_files/00096240_000490_monografia01.pdf
    • Vancouver

      Benvegmi G. Sumarização de documentos do arcabouço regulatório financeiro brasileiro [Internet]. 2024 ;[citado 2025 mar. 24 ] Available from: https://pecepoli.com.br/m_files/00096240_000490_monografia01.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Biblioteca Digital de Trabalhos Acadêmicos da Universidade de São Paulo     2012 - 2025