Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais (2021)
- Authors:
- Autor USP: GIANESI, BRUNO HONORIO DO CARMO - EESC
- Unidade: EESC
- Sigla do Departamento: SEM
- Subjects: APRENDIZADO COMPUTACIONAL; CLASSIFICAÇÃO; RECONHECIMENTO DE VOZ
- Keywords: Reconhecimento automático de gênero; Classificação de gênero
- Language: Português
- Abstract: A tarefa de classificação de gênero baseada na voz identifica automaticamente uma voz como masculina ou feminina, a partir de um arquivo de áudio. Ela tem sido amplamente utilizada e abordada por vários métodos computacionais diferentes, tanto os de aprendizado de máquina tradicionais como os de redes neurais profundas (Deep Learning). Neste trabalho, avaliamos métodos de aprendizado de máquina tradicionais e comparamos o uso de diferentes features e modelos em datasets distintos a fim de determinar a combinação que tem o melhor desempenho na tarefa de classificação de gênero baseada na voz. Além disso, também avaliamos o quanto os modelos treinados em um dataset de áudios em português do Brasil gravados em um ambiente controlado generalizam para outros contextos, como outros idiomas (escolhemos o inglês) e ambientes com ruído. Ainda, buscamos também entender se a duração do áudio utilizado no treinamento influencia na precisão dos modelos. Como resultado, constatamos que a combinação do modelo treinado com o método gradient boosting, utilizando a agregação das features de frequência fundamental, Mel-frequency cepstral coefficients (MFCCs) e estatísticas de frequência foi a que teve melhor acurácia no geral (94,1% no CETUC, 91,5% no MLS, 75,3% no Common Voice em português, 90,8% no MLS com ruído e 82,4% no Common Voice em inglês). Também inferimos que os modelos conseguiram generalizar para áudios em língua inglesa e com ruído, com bom desempenho. Por fim, em relação à duração do áudio, entendeu-se que, dependendo da feature utilizada, a precisão do modelo pode ser afetada negativamente com a redução da duração do dado.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2021
-
ABNT
GIANESI, Bruno Honorio do Carmo. Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais. 2021. Trabalho de Conclusão de Curso (Graduação) – Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos, 2021. Disponível em: https://bdta.abcd.usp.br/directbitstream/93fced06-d7a6-424d-bd41-fb39d0c175e1/Gianesi_Bruno_tcc.pdf. Acesso em: 18 mar. 2025. -
APA
Gianesi, B. H. do C. (2021). Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais (Trabalho de Conclusão de Curso (Graduação). Escola de Engenharia de São Carlos, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/93fced06-d7a6-424d-bd41-fb39d0c175e1/Gianesi_Bruno_tcc.pdf -
NLM
Gianesi BH do C. Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais [Internet]. 2021 ;[citado 2025 mar. 18 ] Available from: https://bdta.abcd.usp.br/directbitstream/93fced06-d7a6-424d-bd41-fb39d0c175e1/Gianesi_Bruno_tcc.pdf -
Vancouver
Gianesi BH do C. Classificação de gênero via análise de áudio utilizando métodos de aprendizado de máquina tradicionais [Internet]. 2021 ;[citado 2025 mar. 18 ] Available from: https://bdta.abcd.usp.br/directbitstream/93fced06-d7a6-424d-bd41-fb39d0c175e1/Gianesi_Bruno_tcc.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Gianesi_Bruno_tcc.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas