Uso do processamento de linguagem natural no desenvolvimento de um sistema de organização do conhecimento: um estudo de caso de documentação na área da saúde (2024)
- Authors:
- Autor USP: GOULART, AILA RENATA OKADA - ECA
- Unidade: ECA
- Sigla do Departamento: CBD
- Subjects: LINGUAGENS DOCUMENTÁRIAS; TERMINOLOGIA; PROCESSAMENTO DE LINGUAGEM NATURAL; INFORMAÇÃO EM SAÚDE; DOENÇAS NEGLIGENCIADAS
- Keywords: Terminology; Corpus linguistics; Natural language processing; Neglected diseases
- Language: Português
- Abstract: O presente trabalho tem como proposta averiguar a possibilidade de utilizar técnicas de Processamento de Linguagem Natural (PLN) e de análise de Linguística de Corpus na construção de uma Terminologia na área da saúde. O objetivo geral é averiguar como a recuperação e o acesso à informação podem ser beneficiados pelo PLN; como objetivos específicos foram estabelecidos a definição de Processamento de Linguagem Natural, e em quais áreas relacionadas à Biblioteconomia ele poderia ser aplicado, no caso a Linguística Documentária, Terminologia e Linguística de Corpus. A metodologia utilizada foi a de revisão bibliográfica seguida de uma parte prática por meio de levantamento de termos relacionados às denominadas Doenças Negligenciadas utilizando as ferramentas de pesquisa e análise de corpus BootCat e AntConc. Os termos utilizados para a pesquisa do corpus foram: doenças negligenciadas, doenças esquecidas, doenças tropicais negligenciadas, elefantíase filarial, helmintíase, hanseníase, oncocercose, esquistossomose, tracoma e popular. Os resultados obtidos dessas buscas foram: 126 termos recuperados no total, dos quais foram selecionados 32 substantivos para a confecção da fichas terminológicas de cada uma dessas palavras: Brasil, casos, causa, cegueira, Chagas, controle, cura, dengue, dia, diagnóstico, doença, eliminação, esquistossomose, filariose, hanseníase, helmintíase, hepatites, iniciativa, leishmaniose, malária, oncocercose, pessoa, problema, raiva, rios, saúde, sintomas, tracoma, transmissão, tratamento e tuberculose. Os termos levantados foram utilizados para a elaboração de uma árvore de domínio terminológico. Com a pesquisa, observou-se que os termos com maior número de ocorrências são “esquistossomose” e “hanseníase”, com 17 e 21 termos candidatos, respectivamente, e que “doenças esquecidas”, “elefantíase filarial”, “helmintíase” e “popular”, foram os termos pesquisadoque não apresentaram termos candidatos. Discute-se a possibilidade da seleção do português como filtro de busca ter influenciado nos resultados obtidos. Também foi observado que muitos documentos e informações recuperados são provenientes de sites da área da saúde. Embora este resultado tenha sido inesperado, o uso das técnicas de PLN e de Linguística de Corpus mostrou-se pertinente e satisfatório nos estudos terminológicos
- Imprenta:
-
ABNT
GOULART, Aila Renata Okada. Uso do processamento de linguagem natural no desenvolvimento de um sistema de organização do conhecimento: um estudo de caso de documentação na área da saúde. 2024. Trabalho de Conclusão de Curso (Graduação) – Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/885de098-cd2e-4a6c-90df-572c573a61b3/tc5029-Aila-Goulart-Uso.pdf. Acesso em: 22 mar. 2025. -
APA
Goulart, A. R. O. (2024). Uso do processamento de linguagem natural no desenvolvimento de um sistema de organização do conhecimento: um estudo de caso de documentação na área da saúde (Trabalho de Conclusão de Curso (Graduação). Escola de Comunicações e Artes, Universidade de São Paulo, São Paulo. Recuperado de https://bdta.abcd.usp.br/directbitstream/885de098-cd2e-4a6c-90df-572c573a61b3/tc5029-Aila-Goulart-Uso.pdf -
NLM
Goulart ARO. Uso do processamento de linguagem natural no desenvolvimento de um sistema de organização do conhecimento: um estudo de caso de documentação na área da saúde [Internet]. 2024 ;[citado 2025 mar. 22 ] Available from: https://bdta.abcd.usp.br/directbitstream/885de098-cd2e-4a6c-90df-572c573a61b3/tc5029-Aila-Goulart-Uso.pdf -
Vancouver
Goulart ARO. Uso do processamento de linguagem natural no desenvolvimento de um sistema de organização do conhecimento: um estudo de caso de documentação na área da saúde [Internet]. 2024 ;[citado 2025 mar. 22 ] Available from: https://bdta.abcd.usp.br/directbitstream/885de098-cd2e-4a6c-90df-572c573a61b3/tc5029-Aila-Goulart-Uso.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
tc5029-Aila-Goulart-Uso.p... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas