Análise comparativa entre redes GANs e modelos de difusão para geração de imagens sintéticas aplicadas ao reconhecimento de espécies arbóreas (2024)
- Authors:
- Autor USP: SEQUEIRA, LUCAS NUNES - ICMC
- Unidade: ICMC
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL; REDES NEURAIS
- Keywords: GANs; Geração de Imagens Sintéticas; Modelos de difusão; Reconhecimento de espécies arbóreas; Ampliação de Conjunto de Dados
- Language: Português
- Abstract: Este trabalho visa aprimorar o reconhecimento de espécies arbóreas utilizando técnicas de aprendizado de máquina e redes neurais profundas, especificamente GANs (Generative Adversarial Networks) e Modelos de Difusão, para ampliar conjuntos de dados florestais por meio de imagens sintéticas. O pipeline de geração de dados foi validado inicialmente com o conjunto FashionMNIST e, em seguida, aplicado a imagens de cortes transversais de madeira fornecidas pelo GIC/UTFPR (Grupo de Inteligência Computacional da Universidade Tecnológica Federal do Paraná). Foram ajustadas arquiteturas generativas utilizando transferência de aprendizado para classes menos representadas, visando otimizar a qualidade das imagens. A eficácia dos modelos foi avaliada por métricas como FID (Fréchet Inception Distance) e IS (Inception Score), além de uma rede classificadora YOLOv8. Os resultados mostraram que os modelos U-Net com difusão superaram as DCGANs (Deep Convolutional GANs) na geração de imagens mais realistas. No experimento com o FashionMNIST, houve uma melhora de 2% no F1-score para a classe rara com a DCGAN e de 4% com Redes Difusoras, sem prejudicar outras classes. Contudo, nas imagens de cortes de madeira, apesar de um aumento de 7% no F1-score para a classe rara com DCGAN e de 14% com Redes Difusoras, houve uma redução de 10% no F1-score macro considerando todas as classes, afetando o desempenho geral. Apesar dos resultados promissores, foram identificadas limitações na geração de texturas complexas, como as de madeira, e no aumento indiscriminado dos conjuntos de dados com dados sintéticos, que nem sempre melhorou o desempenho geral. Futuras pesquisas devem focar no refinamento das técnicas de geração de imagens, na exploração de diferentes arquiteturas de GANs, técnicas de difusão e imagens coloridas para a incorporação de dados sintéticos nos conjuntos de treinamento.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2024
-
ABNT
SEQUEIRA, Lucas Nunes. Análise comparativa entre redes GANs e modelos de difusão para geração de imagens sintéticas aplicadas ao reconhecimento de espécies arbóreas. 2024. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2024. Disponível em: https://bdta.abcd.usp.br/directbitstream/bd98ff72-de34-4e7c-a47c-d640ba3c9db1/Lucas_Nunes_Sequeira.pdf. Acesso em: 25 mar. 2025. -
APA
Sequeira, L. N. (2024). Análise comparativa entre redes GANs e modelos de difusão para geração de imagens sintéticas aplicadas ao reconhecimento de espécies arbóreas (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/bd98ff72-de34-4e7c-a47c-d640ba3c9db1/Lucas_Nunes_Sequeira.pdf -
NLM
Sequeira LN. Análise comparativa entre redes GANs e modelos de difusão para geração de imagens sintéticas aplicadas ao reconhecimento de espécies arbóreas [Internet]. 2024 ;[citado 2025 mar. 25 ] Available from: https://bdta.abcd.usp.br/directbitstream/bd98ff72-de34-4e7c-a47c-d640ba3c9db1/Lucas_Nunes_Sequeira.pdf -
Vancouver
Sequeira LN. Análise comparativa entre redes GANs e modelos de difusão para geração de imagens sintéticas aplicadas ao reconhecimento de espécies arbóreas [Internet]. 2024 ;[citado 2025 mar. 25 ] Available from: https://bdta.abcd.usp.br/directbitstream/bd98ff72-de34-4e7c-a47c-d640ba3c9db1/Lucas_Nunes_Sequeira.pdf
Download do texto completo
Tipo | Nome | Link | |
---|---|---|---|
Lucas_Nunes_Sequeira.pdf | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas