Exportar registro bibliográfico

Uso do processamento de linguagem natural para extração de dados nos registros de câncer (2024)

  • Authors:
  • Autor USP: SANTOS, ANDRÉ LUIZ PINTO - ICMC
  • Unidade: ICMC
  • Subjects: PROCESSAMENTO DE LINGUAGEM NATURAL; NEOPLASIAS
  • Keywords: Registro de câncer; Qualidade de dados
  • Language: Português
  • Abstract: Na saúde, o Processamento de Linguagem Natural (PLN) tem se mostrado uma ferramenta poderosa na extração e estruturação de dados clínicos a partir de textos não estruturados, tornando esse processo mais rápido, preciso e menos sujeito a erros humanos. Nos registros de câncer são coletados, manualmente, dados essenciais para avaliar o perfil epidemiológico, a qualidade da assistência prestada e para o cumprimento de obrigações legais, a partir de laudos e notas clínicas. Com a implantação do Registro Eletrônico de Saúde (RES) no Hospital de Amor, tornou-se viável a utilização de textos para treinar modelos de PLN que possam auxiliar na extração de variáveis coletadas pelos registradores. O objetivo do presente trabalho foi treinar algoritmos de PLN que auxiliem na extração de variáveis coletadas manualmente nos registros de câncer a partir de textos de laudos de biópsias e narrativas clínicas. Os documentos foram pré-processados, vetorizados com TF-IDF(Term Frequency-Inverse Document Frequency) e BioBERTpt, e treinados usando algoritmos de aprendizado de máquina (regressão logística, random forest, Support Vector Machine, Naive Bayes e gradient boosting) para extrair informações sobre malignidade, topografia, morfologia e estadiamento de tumores. Os melhores modelos alcançaram acurácias superiores a 92%, 96% e 88% na extração de malignidade, topografia e morfologia, respectivamente. No entanto, os modelos enfrentaram dificuldades na extração de estadiamento devido à ausência dessa informação nas evoluções médicas, evidenciando uma limitação na qualidade das narrativas clínicas. A implementação desses modelos na rotina dos registros de câncer pode otimizar o trabalho dos registradores, melhorar a qualidade dos dados e reduzir o tempo de disponibilização das informações. Além disso, ao identificar lacunas na documentação clínica, os modA implementação desses modelos na rotina dos registros de câncer pode otimizar o trabalho dos registradores, melhorar a qualidade dos dados e reduzir o tempo de disponibilização das informações. Além disso, ao identificar lacunas na documentação clínica, os modelos também podem contribuir para a melhoria da qualidade das informações textuais no RES. A disponibilização desses modelos poderá beneficiar outros hospitais, otimizando a coleta de dados e possibilitando decisões clínicas e políticas públicas mais assertivas no controle do câncer.
  • Imprenta:

  • Download do texto completo

    Tipo Nome Link
    Versão Publicada André_Luiz_Pinto_Santos.... Direct link
    How to cite
    A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas

    • ABNT

      SANTOS, André Luiz Pinto. Uso do processamento de linguagem natural para extração de dados nos registros de câncer. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/2b30c072-0ab3-48cf-9195-abd0c2d0ad73/Andr%C3%A9_Luiz_Pinto_Santos.pdf. Acesso em: 28 mar. 2025.
    • APA

      Santos, A. L. P. (2024). Uso do processamento de linguagem natural para extração de dados nos registros de câncer (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/2b30c072-0ab3-48cf-9195-abd0c2d0ad73/Andr%C3%A9_Luiz_Pinto_Santos.pdf
    • NLM

      Santos ALP. Uso do processamento de linguagem natural para extração de dados nos registros de câncer [Internet]. 2024 ;[citado 2025 mar. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/2b30c072-0ab3-48cf-9195-abd0c2d0ad73/Andr%C3%A9_Luiz_Pinto_Santos.pdf
    • Vancouver

      Santos ALP. Uso do processamento de linguagem natural para extração de dados nos registros de câncer [Internet]. 2024 ;[citado 2025 mar. 28 ] Available from: https://bdta.abcd.usp.br/directbitstream/2b30c072-0ab3-48cf-9195-abd0c2d0ad73/Andr%C3%A9_Luiz_Pinto_Santos.pdf

    Últimas obras dos mesmos autores vinculados com a USP cadastradas na BDPI:

    Biblioteca Digital de Trabalhos Acadêmicos da Universidade de São Paulo     2012 - 2025