Uso de Transformada de Pacotes Wavelet e Aprendizado Profundo no Reconhecimento de Emoções na Fala: Aplicações nas Bases CORAA e SofiaFala (2024)
- Authors:
- Autor USP: COSTA, VINICIUS RODRIGUES - ICMC
- Unidade: ICMC
- Subjects: RECONHECIMENTO DA FALA; PERCEPÇÃO DA FACE; APRENDIZADO COMPUTACIONAL; REDES NEURAIS
- Keywords: Transformada de Pacotes Wavelet; Fala Espontânea; Reconhecimento de Emoções na Fala
- Language: Português
- Abstract: O reconhecimento de emoções na fala é fundamental para uma variedade de aplicações, desde interfaces de usuário mais empáticas até soluções assistivas para o suporte a tratamentos de fonoaudiologia e para o aprimoramento de ferramentas educacionais. A metodologia deste trabalho explora o uso da transformada de pacotes de Wavelet, aplicada para decompor o espectrograma Mel dos áudios em sub-bandas de frequência, combinada com redes neurais convolucionais para a classificação das emoções, visando o reconhecimento de emoções na fala, com foco na base de fala espontânea CORAA, composta por dados em português. O objetivo principal foi desenvolver um modelo capaz de lidar com as complexidades de dados de fala natural, com potencial aplicação em projetos como o SofiaFala, aplicativo assistivo projetado para apoiar o tratamento de pessoas com deficiências de fala. Os experimentos demonstraram que, embora a proposta tenha alcançado resultados comparáveis aos melhores obtidos com a base CORAA e próximos aos obtidos com a transformada discreta de Wavelet, o uso de redes neurais pré-treinadas ainda se mostrou superior. Adicionalmente, foram realizadas avaliações com outras bases de dados, como EMODB, SAVEE e RAVDESS, para verificar a generalização do modelo. Ao aplicar o modelo nos dados do SofiaFala, observou-se um possível viés de classificação em áudios de pessoas com deficiência de fala. O modelo atribuiu a mesma classificação a todos os áudios de um mesmo falante, independentemente do conteúdo emocional, tornando-o inadequado para esse tipo de aplicação. Este trabalho conclui que, apesar dos resultados promissores, há espaço para melhorias, incluindo o uso de modelos pré-treinados, técnicas adicionais de aumento de dados e ajustes finos nos parâmetros de extração de características. Além disso, seria interessante realizar uma marcação mais detalhada da base SofiaFala, o que poderia levar a uma melhoria nosnos resultados.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
-
ABNT
COSTA, Vinicius Rodrigues. Uso de Transformada de Pacotes Wavelet e Aprendizado Profundo no Reconhecimento de Emoções na Fala: Aplicações nas Bases CORAA e SofiaFala. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/861d542e-00df-4ba7-a9e9-747dd968b0ea/Vinicius_Rodrigues_Costa.pdf. Acesso em: 26 mar. 2025. -
APA
Costa, V. R. (2024). Uso de Transformada de Pacotes Wavelet e Aprendizado Profundo no Reconhecimento de Emoções na Fala: Aplicações nas Bases CORAA e SofiaFala (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/861d542e-00df-4ba7-a9e9-747dd968b0ea/Vinicius_Rodrigues_Costa.pdf -
NLM
Costa VR. Uso de Transformada de Pacotes Wavelet e Aprendizado Profundo no Reconhecimento de Emoções na Fala: Aplicações nas Bases CORAA e SofiaFala [Internet]. 2024 ;[citado 2025 mar. 26 ] Available from: https://bdta.abcd.usp.br/directbitstream/861d542e-00df-4ba7-a9e9-747dd968b0ea/Vinicius_Rodrigues_Costa.pdf -
Vancouver
Costa VR. Uso de Transformada de Pacotes Wavelet e Aprendizado Profundo no Reconhecimento de Emoções na Fala: Aplicações nas Bases CORAA e SofiaFala [Internet]. 2024 ;[citado 2025 mar. 26 ] Available from: https://bdta.abcd.usp.br/directbitstream/861d542e-00df-4ba7-a9e9-747dd968b0ea/Vinicius_Rodrigues_Costa.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Vinicius_Rodrigues_Costa.... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas