Sumarização de documentos do arcabouço regulatório financeiro brasileiro (2024)
- Authors:
- Autor USP: BENVEGMI, GABRIEL - EP
- Unidade: EP
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; APRENDIZADO COMPUTACIONAL; MERCADO FINANCEIRO
- Language: Português
- Abstract: Este trabalho analisa criticamente o uso de alguns modelos de linguagem grandes (LLMs) para o caso particular de sumarização automática de documentos do arcabouço regulatório financeiro brasileiro, em especial os ofícios e comunicados publicados pela B3, a bolsa de valores brasileira. Um conjunto de dados padrão ouro foi compilado, anotado e revisado especificamente para este trabalho a partir de documentos publicamente disponíveis no endereço eletrônico da B3, o que contemplou, no processo, a criação de sumários de referência por avaliadores humanos. A abordagem de sumarização empregada foi a abstrativa, implementada por meio da adoção e comparação de diferentes modelos de linguagem, sendo eles: Bode 7B, PTT5 Base e o mais recentemente publicado Mistral 7B. Os documentos originais do conjunto de dados de validação continham, em média, aproximadamente 198 tokens e, através da sumarização, foram reduzidos para uma média de 129 tokens pelo modelo Mistral, e 93 tokens pelo PTT5, respectivamente. Na avaliação dos resultados, o Mistral superou os demais, com um ROUGE de aproximadamente 0,81 nos dados de validação, contra 0,61 do segundo colocado, o PTT5, que, ainda assim, exige uma menor quantidade de recursos computacionais para seu ajuste fino e geração textual que o primeiro, sendo possivelmente um caso de bom custo-benefício. Possibilidades futuras são também consideradas com base nos resultados como, por exemplo, fazer uma análise utilizando a abordagem de sumarização híbrida – que contempla o uso combinado de abordagens extrativa e abstrativa –, ou mesmo de continuar o ajuste fino dos modelos usados com outras entidades do meio regulatório financeiro brasileiro.
- Imprenta:
-
ABNT
BENVEGMI, Gabriel. Sumarização de documentos do arcabouço regulatório financeiro brasileiro. 2024. Trabalho de Conclusão de Curso (Especialização) – Escola Politécnica, Universidade de São Paulo, São Paulo, 2024. Disponível em: https://pecepoli.com.br/m_files/00096240_000490_monografia01.pdf. Acesso em: 24 mar. 2025. -
APA
Benvegmi, G. (2024). Sumarização de documentos do arcabouço regulatório financeiro brasileiro (Trabalho de Conclusão de Curso (Especialização). Escola Politécnica, Universidade de São Paulo, São Paulo. Recuperado de https://pecepoli.com.br/m_files/00096240_000490_monografia01.pdf -
NLM
Benvegmi G. Sumarização de documentos do arcabouço regulatório financeiro brasileiro [Internet]. 2024 ;[citado 2025 mar. 24 ] Available from: https://pecepoli.com.br/m_files/00096240_000490_monografia01.pdf -
Vancouver
Benvegmi G. Sumarização de documentos do arcabouço regulatório financeiro brasileiro [Internet]. 2024 ;[citado 2025 mar. 24 ] Available from: https://pecepoli.com.br/m_files/00096240_000490_monografia01.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Gabriel_Benvegmi.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas