9788418892943. Browner_Diseño de investigaciones clínicas_5e

252

Sección II • Diseños de estudios

908 lactantes < 60 días, 82 (9%) con infección bacteriana grave

¿Análisis de orina positivo?

Mayor riesgo (63/127 = 50%)

¿Recuento absoluto de neutró…los > 4090/ μ L?

Mayor riesgo (15/248 = 6%)

¿Procalcitonina > 1.71 ng/mL?

Mayor riesgo (3/11 = 27%)

Riesgo bajo (1/522 = 0.2%)

Validación del modelo Independientemente del método elegido para desarrollar el modelo de predicción, este debe ser vali dado en un grupo de pacientes diferentes de aquellos de los que se derivó . Así se evitan las estimaciones demasiado optimistas del rendimiento del modelo que resultan del sobreajuste, el cual, como ya se ha comentado, implica la sobreinterpretación de la variabilidad aleatoria de una muestra (24). El árbol de clasificación del estudio PECARN de la figura 13-2 lo ilustra: los valores de corte específicos seleccio nados para el recuento absoluto de neutrófilos (4 090/µL) y la procalcitonina (1.71 ng/mL) fueron iden tificados presumiblemente por el programa informático de partición recursiva porque los números más redondos para los valores de corte no funcionaron tan bien. La validación de la muestra dividida , el método más sencillo, permite estimar el grado de sobrea juste al dividir de manera aleatoria la cohorte en conjuntos de datos de derivación (por lo general, del 50-67% de la muestra) y de validación , así como probar la regla derivada de la cohorte de derivación en la cohorte de validación. En el estudio PECARN, la regla de predicción clínica se validó en una muestra sepa rada del 50%. Es impresionante que el rendimiento en el conjunto de validación fuese solo un poco peor que en el de derivación: la sensibilidad disminuyó del 98.8% al 97.7% y la especificidad del 63.1% al 60%. La validación de la muestra dividida sacrifica parte del tamaño de esta para conservar un conjunto de validación separado. Por el contrario, la validación cruzada de k iteraciones utiliza eficientemente todas las observaciones de la muestra tanto para la derivación del modelo como para su validación. La muestra del estudio se divide en k grupos y se utiliza un proceso (p. ej., regresión logística por pasos) para selec cionar las variables y derivar el mejor modelo en k − 1 de estos grupos y probarlo en el restante. Esto se repite k veces. Por ejemplo, se podría dividir aleatoriamente la muestra de 1000 pacientes en cinco grupos de 200. Para cada uno de los cinco grupos, se derivaría el modelo usando los otros cuatro y se generarían valores previstos para el grupo que queda fuera (para un total de cinco rondas de derivación y pruebas). El modelo final se obtiene utilizando el proceso en el conjunto de datos completo, pero el AUROC y otras ■ FIGURA 13-2 Ejemplo de un árbol de clasificación y regresión para identificar a los lactantes febriles menores de 60 días de edad con bajo riesgo de infecciones bacterianas graves. Los recuadros de color azul claro con preguntas dividen a los lactantes en los de mayor riesgo de infección bacteriana ( recuadros rojos ) y los de menor riesgo ( recuadro verde ); los números muestran las proporciones con «infecciones bacterianas graves» en las «ramas terminales» rojas y verdes del árbol (datos de Kuppermann N, Dayan PS, Levine DA, et al. A clinical prediction rule to identify febrile infants 60 days and younger at low risk for serious bacterial infections. JAMA Pediatr . 2019;173(4):342-351). SAMPLE

Made with FlippingBook Annual report maker