Classificação temática multirrótulo de proposições legislativas utilizando técnicas de mineração de textos e aprendizado de máquina (2024)
- Authors:
- Autor USP: OLIVEIRA, THALES DOS SANTOS - ICMC
- Unidade: ICMC
- DOI: 10.11606/003225058
- Subjects: INTELIGÊNCIA ARTIFICIAL; SERVIÇO PÚBLICO
- Keywords: Classificação multirrótulo; Mineração de textos
- Language: Português
- Abstract: Em instituições públicas, a correta gestão da informação permite que dados relevantes para a população sejam organizados e acessíveis. Quando a gestão da informação é realizada corretamente, o processo pode ajudar a reduzir a redundância e os erros administrativos, promovendo um uso mais racional dos recursos públicos e atendendo a normas legais, como a Lei de Acesso à Informação (LAI). O Centro de Documentação e Informação é a unidade responsável pela gestão da informação na Câmara dos Deputados. Em sua estrutura institucional, a Seção de Indexação de Matérias Legislativas tem o dever de indexar as proposições legislativas submetidas à casa, atribuindo a cada uma delas termos e informações de forma a permitir sua catalogação e buscas futuras. Parte deste processo envolve a classificação das proposições em um ou mais temas, presentes em uma lista com 32 opções. Trata-se de um trabalho manual e que requer extrema atenção dos Analistas Legislativos, profissionais que realizam esta tarefa. A indexação manual sabidamente está sujeita a desafios relacionados ao condicionamento humano como subjetividade, conhecimento prévio e neutralidade do profissional. Considerando os desafios mencionados e a quantidade de proposições submetidas anualmente, torna-se interessante a busca de soluções para classificação automática de proposições por temas.Esta pesquisa teve como objetivo projetar, implementar e avaliar um sistema de classificação multirrótulo automática de temas de proposições legislativas por meio de técnicas de Mineração de Textos (MT). Para isso, utilizou-se dados disponibilizados pelo Portal da Câmara dos Deputados contendo as proposições legislativas submetidas entre os anos de 2013 e 2023, em que cada uma das proposições foi manualmente classificada pela Seção de Indexação de Matérias Legislativas. Este trabalho avaliou 53 combinações de classificadores dos tipos Problem Transformation e Algorithm Classification para que se pudesse entender a viabilidade da aplicação e quais os classificadores mais indicados para o problema. Os resultados demonstraram que soluções utilizando técnicas de Inteligência Artificial são promissoras, com algumas limitações, e que novas linhas de pesquisa têm potencial de levar a maiores valores de F1-score e Subset Accuracy. O trabalho impacta positivamente o processo de indexação de proposições legislativas uma vez que apresenta técnicas de Mineração de Textos como exemplo de auxílio viável a servidores públicos que realizam a classificação temática das proposições.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
OLIVEIRA, Thales dos Santos. Classificação temática multirrótulo de proposições legislativas utilizando técnicas de mineração de textos e aprendizado de máquina. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://doi.org/10.11606/003225058. Acesso em: 13 jan. 2026. -
APA
Oliveira, T. dos S. (2024). Classificação temática multirrótulo de proposições legislativas utilizando técnicas de mineração de textos e aprendizado de máquina (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://doi.org/10.11606/003225058 -
NLM
Oliveira T dos S. Classificação temática multirrótulo de proposições legislativas utilizando técnicas de mineração de textos e aprendizado de máquina [Internet]. 2024 ;[citado 2026 jan. 13 ] Available from: https://doi.org/10.11606/003225058 -
Vancouver
Oliveira T dos S. Classificação temática multirrótulo de proposições legislativas utilizando técnicas de mineração de textos e aprendizado de máquina [Internet]. 2024 ;[citado 2026 jan. 13 ] Available from: https://doi.org/10.11606/003225058
Informações sobre o DOI: 10.11606/003225058 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| Thales_dos_Santos_Oliveir... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
