Uso do processamento de linguagem natural para extração de dados nos registros de câncer (2024)
- Authors:
- Autor USP: SANTOS, ANDRÉ LUIZ PINTO - ICMC
- Unidade: ICMC
- Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; NEOPLASIAS
- Keywords: Registro de câncer; Qualidade de dados
- Language: Português
- Abstract: Na saúde, o Processamento de Linguagem Natural (PLN) tem se mostrado uma ferramenta poderosa na extração e estruturação de dados clínicos a partir de textos não estruturados, tornando esse processo mais rápido, preciso e menos sujeito a erros humanos. Nos registros de câncer são coletados, manualmente, dados essenciais para avaliar o perfil epidemiológico, a qualidade da assistência prestada e para o cumprimento de obrigações legais, a partir de laudos e notas clínicas. Com a implantação do Registro Eletrônico de Saúde (RES) no Hospital de Amor, tornou-se viável a utilização de textos para treinar modelos de PLN que possam auxiliar na extração de variáveis coletadas pelos registradores. O objetivo do presente trabalho foi treinar algoritmos de PLN que auxiliem na extração de variáveis coletadas manualmente nos registros de câncer a partir de textos de laudos de biópsias e narrativas clínicas. Os documentos foram pré-processados, vetorizados com TF-IDF(Term Frequency-Inverse Document Frequency) e BioBERTpt, e treinados usando algoritmos de aprendizado de máquina (regressão logística, random forest, Support Vector Machine, Naive Bayes e gradient boosting) para extrair informações sobre malignidade, topografia, morfologia e estadiamento de tumores. Os melhores modelos alcançaram acurácias superiores a 92%, 96% e 88% na extração de malignidade, topografia e morfologia, respectivamente. No entanto, os modelos enfrentaram dificuldades na extração de estadiamento devido à ausência dessa informação nas evoluções médicas, evidenciando uma limitação na qualidade das narrativas clínicas. A implementação desses modelos na rotina dos registros de câncer pode otimizar o trabalho dos registradores, melhorar a qualidade dos dados e reduzir o tempo de disponibilização das informações. Além disso, ao identificar lacunas na documentação clínica, os modA implementação desses modelos na rotina dos registros de câncer pode otimizar o trabalho dos registradores, melhorar a qualidade dos dados e reduzir o tempo de disponibilização das informações. Além disso, ao identificar lacunas na documentação clínica, os modelos também podem contribuir para a melhoria da qualidade das informações textuais no RES. A disponibilização desses modelos poderá beneficiar outros hospitais, otimizando a coleta de dados e possibilitando decisões clínicas e políticas públicas mais assertivas no controle do câncer.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
-
ABNT
SANTOS, André Luiz Pinto. Uso do processamento de linguagem natural para extração de dados nos registros de câncer. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/2b30c072-0ab3-48cf-9195-abd0c2d0ad73/Andr%C3%A9_Luiz_Pinto_Santos.pdf. Acesso em: 28 mar. 2025. -
APA
Santos, A. L. P. (2024). Uso do processamento de linguagem natural para extração de dados nos registros de câncer (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/2b30c072-0ab3-48cf-9195-abd0c2d0ad73/Andr%C3%A9_Luiz_Pinto_Santos.pdf -
NLM
Santos ALP. Uso do processamento de linguagem natural para extração de dados nos registros de câncer [Internet]. 2024 ;[citado 2025 mar. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/2b30c072-0ab3-48cf-9195-abd0c2d0ad73/Andr%C3%A9_Luiz_Pinto_Santos.pdf -
Vancouver
Santos ALP. Uso do processamento de linguagem natural para extração de dados nos registros de câncer [Internet]. 2024 ;[citado 2025 mar. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/2b30c072-0ab3-48cf-9195-abd0c2d0ad73/Andr%C3%A9_Luiz_Pinto_Santos.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
André_Luiz_Pinto_Santos.... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas