Título: Predição de bacteremias por bactérias Gram-positivas ou Gram-negativas: uma análise preliminar com reamostragem e seleção de variáveis
Autor(es): Juliana Nascimento de Paula, Josmar Mazucheli
Resumo:
A diferenciação precoce entre bacteremias causadas por bactérias Gram-positivas e Gramnegativas é essencial para a escolha apropriada da terapia antimicrobiana. Neste trabalho, utilizamos dados do Hospital Universitário de Maringá, com informações laboratoriais de 523 pacientes com infecção da corrente sanguínea, para investigar a capacidade discriminativa de biomarcadores de rotina. Inicialmente, foi realizada uma análise exploratória detalhada das 71 variáveis disponíveis, incluindo estimativas de densidade Kernel, medidas resumo e cálculo da ASC-ROC individual. Em seguida, aplicaram-se critérios de filtragem com base na proporção de dados ausentes, alta correlação e variabilidade quase nula, resultando em um subconjunto com 326 observações completas e 21 variáveis. Dado o número relativamente alto de preditores em relação ao número de observações, investigou-se a estabilidade da seleção de variáveis por meio de reamostragem. Considerando modelos de regressão logística, foram empregados três métodos: Bootstrap(n), Bootstrap(m) e Subsampling(m), com n = 326 e m = ⌊0,632 · n⌋, 5000 replicações e três estratégias de seleção (backward, forward e stepwise), sob diferentes níveis de significância. A variável Hemácias destacou-se por apresentar elevada frequência de inclusão em grande parte dos cenários, sugerindo relevância preditiva robusta. Os métodos baseados em Subsampling(m) mostraram-se mais parcimoniosos e estáveis. Como próximos passos, os preditores mais estáveis serão utilizados para ajustar e comparar modelos preditivos, como regressão logística, árvores de decisão e florestas aleatórias.