Uso do processamento de linguagem natural para extração de dados nos registros de câncer (2024)
- Authors:
- Autor USP: SANTOS, ANDRÉ LUIZ PINTO - ICMC
- Unidade: ICMC
- DOI: 10.11606/003225313
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; NEOPLASIAS
- Keywords: Registro de câncer; Qualidade de dados
- Language: Português
- Abstract: Na saúde, o Processamento de Linguagem Natural (PLN) tem se mostrado uma ferramenta poderosa na extração e estruturação de dados clínicos a partir de textos não estruturados, tornando esse processo mais rápido, preciso e menos sujeito a erros humanos. Nos registros de câncer são coletados, manualmente, dados essenciais para avaliar o perfil epidemiológico, a qualidade da assistência prestada e para o cumprimento de obrigações legais, a partir de laudos e notas clínicas. Com a implantação do Registro Eletrônico de Saúde (RES) no Hospital de Amor, tornou-se viável a utilização de textos para treinar modelos de PLN que possam auxiliar na extração de variáveis coletadas pelos registradores. O objetivo do presente trabalho foi treinar algoritmos de PLN que auxiliem na extração de variáveis coletadas manualmente nos registros de câncer a partir de textos de laudos de biópsias e narrativas clínicas. Os documentos foram pré-processados, vetorizados com TF-IDF(Term Frequency-Inverse Document Frequency) e BioBERTpt, e treinados usando algoritmos de aprendizado de máquina (regressão logística, random forest, Support Vector Machine, Naive Bayes e gradient boosting) para extrair informações sobre malignidade, topografia, morfologia e estadiamento de tumores. Os melhores modelos alcançaram acurácias superiores a 92%, 96% e 88% na extração de malignidade, topografia e morfologia, respectivamente. No entanto, os modelos enfrentaram dificuldades na extração de estadiamento devido à ausência dessa informação nas evoluções médicas, evidenciando uma limitação na qualidade das narrativas clínicas. A implementação desses modelos na rotina dos registros de câncer pode otimizar o trabalho dos registradores, melhorar a qualidade dos dados e reduzir o tempo de disponibilização das informações. Além disso, ao identificar lacunas na documentação clínica, os modA implementação desses modelos na rotina dos registros de câncer pode otimizar o trabalho dos registradores, melhorar a qualidade dos dados e reduzir o tempo de disponibilização das informações. Além disso, ao identificar lacunas na documentação clínica, os modelos também podem contribuir para a melhoria da qualidade das informações textuais no RES. A disponibilização desses modelos poderá beneficiar outros hospitais, otimizando a coleta de dados e possibilitando decisões clínicas e políticas públicas mais assertivas no controle do câncer.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
- Este periódico é de acesso aberto
- Este artigo é de acesso aberto
- URL de acesso aberto
- Cor do Acesso Aberto: gold
- Licença: cc-by-nc-sa
-
ABNT
SANTOS, André Luiz Pinto. Uso do processamento de linguagem natural para extração de dados nos registros de câncer. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://doi.org/10.11606/003225313. Acesso em: 26 dez. 2025. -
APA
Santos, A. L. P. (2024). Uso do processamento de linguagem natural para extração de dados nos registros de câncer (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://doi.org/10.11606/003225313 -
NLM
Santos ALP. Uso do processamento de linguagem natural para extração de dados nos registros de câncer [Internet]. 2024 ;[citado 2025 dez. 26 ] Available from: https://doi.org/10.11606/003225313 -
Vancouver
Santos ALP. Uso do processamento de linguagem natural para extração de dados nos registros de câncer [Internet]. 2024 ;[citado 2025 dez. 26 ] Available from: https://doi.org/10.11606/003225313
Informações sobre o DOI: 10.11606/003225313 (Fonte: oaDOI API)
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| André_Luiz_Pinto_Santos.... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas
