Large language models as feature selectors for predicting ALK-5 inhibition (2025)
- Authors:
- Autor USP: CASAS, WALTER AUGUSTO PEREZ - ICMC
- Unidade: ICMC
- Subjects: INTELIGÊNCIA ARTIFICIAL; APRENDIZADO COMPUTACIONAL
- Keywords: LLM; inhibidores ALK-5
- Language: Inglês
- Abstract: O câncer é uma das principais causas de mortalidade em todo o mundo, principalmente devido à proliferação descontrolada de células tumorais. Uma abordagem promissora para o desenvolvimento de fármacos antineoplásicos envolve a inibição da ALK-5 (Activin-Like Kinase 5), uma molécula-chave na regulação de processos celulares associados ao cresci mento e à disseminação do câncer. Métodos de aprendizado de máquina são amplamente empregados para prever a atividade inibitória (pIC50) de compostos candidatos, sendo treinados com descritores moleculares extraídos da estrutura química dessas moléculas. No entanto, a alta dimensionalidade dessas representações químicas, aliada ao tamanho limitado das amostras, dificulta a generalização dos modelos, frequentemente resultando em overfitting. Neste trabalho, propomos uma abordagem que aproveita as capacidades dos modelos de linguagem de grande escala (LLMs) para selecionar características moleculares mais representativas antes da aplicação de algoritmos convencionais de aprendizado de máquina. Nossos resultados demonstram que a seleção de características assistida por LLMs alcança um desempenho comparável aos métodos tradicionais de seleção de variáveis, como abordagens de filtro, wrapper ou embutidas, baseando-se exclusivamente no conhecimento do modelo, ou seja, de maneira zero-shot. Esse aspecto é particularmente relevante no presente caso, onde reduzimos o número de características de aproximadamente 1400 para apenas 50, forçando o modelo a selecionar as mais relevantes. Isso evidencia o potencial dessa abordagem para aprimorar a eficiência e a eficácia da descoberta de inibidores da ALK-5, além de direcionar os esforços para métodos mais práticos e escaláveis, facilitando, assim, a implementação de soluções em cenários reais.
- Imprenta:
- Publisher place: São Carlos
- Date published: 2025
-
ABNT
CASAS, Walter Augusto Perez. Large language models as feature selectors for predicting ALK-5 inhibition. 2025. Trabalho de Conclusão de Curso (MBA) – Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos, 2025. Disponível em: https://bdta.abcd.usp.br/directbitstream/1903ee98-f68c-4cf3-a0ef-be7f768bb996/Walter_Augusto_Perez_Casas.pdf. Acesso em: 21 jan. 2026. -
APA
Casas, W. A. P. (2025). Large language models as feature selectors for predicting ALK-5 inhibition (Trabalho de Conclusão de Curso (MBA). Instituto de Ciências Matemáticas e de Computação, Universidade de São Paulo, São Carlos. Recuperado de https://bdta.abcd.usp.br/directbitstream/1903ee98-f68c-4cf3-a0ef-be7f768bb996/Walter_Augusto_Perez_Casas.pdf -
NLM
Casas WAP. Large language models as feature selectors for predicting ALK-5 inhibition [Internet]. 2025 ;[citado 2026 jan. 21 ] Available from: https://bdta.abcd.usp.br/directbitstream/1903ee98-f68c-4cf3-a0ef-be7f768bb996/Walter_Augusto_Perez_Casas.pdf -
Vancouver
Casas WAP. Large language models as feature selectors for predicting ALK-5 inhibition [Internet]. 2025 ;[citado 2026 jan. 21 ] Available from: https://bdta.abcd.usp.br/directbitstream/1903ee98-f68c-4cf3-a0ef-be7f768bb996/Walter_Augusto_Perez_Casas.pdf
Download do texto completo
| Tipo | Nome | Link | |
|---|---|---|---|
| Walter_Augusto_Perez_Casa... | Direct link |
How to cite
A citação é gerada automaticamente e pode não estar totalmente de acordo com as normas