Score de predicción de riesgo neonatal
Noviembre 2005
Un nuevo score para predecir el riesgo de mortalidad neonatal del muy bajo peso de nacimiento en la red sudamericana NEOCOSUR
Guillermo Marshall, PhD Jose L. Tapia, MD Ivonne D’Apremont, MD Carlos Grandi, PhD Claudia Barros, MD Angelica Alegria, MD Jane Standen, MD Ruben Panizza, MD Liliana Roldan, MD Gabriel Musante, MD Aldo Bancalari, MD Enrique Bambaren, MD Jose Lacarruba, MD Maria E. Hubner, MD Jorge Fabres, MD Marcelo Decaro, MD Gonzalo Mariani, MD Isabel Kurlat, MD Agustina Gonzalez, MD For the Grupo Colaborativo NEOCOSUR
Departamento de Salud Publica Universidad Catolica (G.M.), Santiago, Chile; Unidad de Neonatologia Hospital Clinico Universidad Catolica (J.L.T., I.D.A., J.F.), Santiago, Chile; Maternidad Sarda (C.G..), Buenos Aires, Argentina; hospital de Unidad de Neonatologia Lagomaggiore (C.B..), Mendoza, Argentina; Unidad de Neonatologia Sotero del Rio del hospital (A.A.), Santiago, Chile; Unidad de Neonatologia Gustavo Fricke (J.S), Vin ˜ del hospital un mar. de supr, Chile; Recien Nacidos Facultad de Medicina (R.P.), Montevideo, Uruguay; Unidad de Neonatologia Juan Fernandez del hospital (L.R), Buenos Aires, Argentina; Clinica Maternidad de y Suizo (G.M.) de Argentina, Buenos Aires, Argentina; Guillermo Grant del hospital (A.B..), Concepcion, Chile; Unidad de Neonatologia Cayetano Heredia del hospital (E.B..), Lima, Perú; el hospital de Clinicas de Asunción (J.L), Paraguay; Clinico Universidad del hospital de Chile (M.E.H), Santiago, Chile; Sanatorio de la (Doctor en Medicina) de Trinidad, Buenos Aires, Argentina; Unidad de Neonatologia Italiano del hospital (G.M.), Buenos Aires, Argentina; Unidad de Neonatologia de Clinicas del hospital Universidad de Buenos Aires (I.K), Argentina; y Unidad de Neonatologia San José del hospital (A.G..), Santiago, Chile.
Journal of Perinatology 2005; 25:577–582
Traducción libre: Dr Gerardo Flores H Pediatra neonátologo Puerto Montt Chile
Introducción
La mortalidad Riesgo-ajustada ha sido utilizada para comparar la performance de los hospitales. Para lograr esta tarea, se han desarrollado modelos de riesgo para ajustar las tasas crudas de mortalidad para diferencias de riesgo del paciente (1- 4).
El desarrollo de una medida del riesgo de mortalidad es esencial para comparar outcomes a través de unidades de cuidado intensivo neonatales (NICUs). La evaluación de prácticas médicas, propósitos de benchmarking y comparaciones de la calidad del cuidado requieren modelos de riesgo exactos y confiables.
Se han desarrollado varios scores de riesgo de mortalidad neonatal , incluyendo el Clinical Risk Index for Babies (CRIB) de la International Neonatal Network (referencia 1) , el score NICHD desarrollado por Horbar y cols (referencia 2) y el Score for Neonatal Acute Physiology y Score for Neonatal Acute Physiology II (SNAP y SNAPPE-II) de Richardson y cols (5-6).
Todos estos score se han desarrollado usando outcomes de redes de NICU en países desarrollados, donde los recursos humanos y técnicos son muy similares con pocas limitaciones.
El propósito de este estudio fue desarrollar un score de riesgo de mortalidad neonatal del para niños de muy bajo peso de nacimiento (VLBW) basado en variables presentes al nacer , antes del ingreso a la unidad de cuidado intensivo neonatal (NICU) en una red multicéntrica sudamericana con diversas tasas de mortalidad y recursos.
Métodos
Fueron incluídos en este estudio todos los niños con peso de nacimiento 500 a 1500 gr nacidos de octubre 1, 2000 a mayo 30, 2003 en 16 centros participantes en la Red Neonatal del Cono Sur (NEOCOSUR) de Argentina, Chile, Paraguay, Perú y Uruguay. La información biodemográfica y los datos de outcome son recolectados prospectivamente y de rutina en la red NEOCOSUR usando criterios de diagnóstico predefinidos y entrada de datos online. Las muertes en sala de partos fueron incluídas.
Los siguientes factores de riesgo asociados a outcome adverso fueron incluidos en el modelo: edad materna, peso de nacimiento, edad gestational, score Apgar al 1 minuto, malformaciones congénitas mayores amenaza aguda grave de vida (ALT) , sexo, nacimiento múltiple, uso de esteroides prenatales y pequeño para edad gestacional (definida como más bajo que Percentil 10 de peso para edad gestacional según un curva de crecimiento nacional chileno (7) . Las malformaciones congénitas ALT incluyeron hernia diafragmática, cardiopatía congénita mayor, atresia intestinal, hydrops y errores innatos del metabolismo, como en el estudio CRIB.
Los factores de riesgo candidatos fueron elegidos entre los descritos en otros estudios y basados en las variables presentes al nacer. La asociación univariable entre estos factores de riesgo infantiles y la mortalidad fue realizada usando un modelo logístico de regresión simple para las variables categóricas y un modelo aditivo logístico generalizado para las variables continuas. Este modelo fue utilizado para evaluar la forma del efecto de las variables continuas, usando estimación de la curva no paramétrica.
Un modelo de regresión logística múltiple pasa a paso fue utilizado para seleccionar el subconjunto de variables que estaban independientemente asociadas con mortalidad. Un nivel de significancia del 5% fue utilizado para incluir una variable en el modelo. Con el desarrollo del modelo final, éramos capaces de estimar la probabilidad de la mortalidad intrahospitalaria para cada niño basado en factores de riesgo prenatales y al ingreso.
El modelo fue desarrollado usando una muestra randomizada consistente en el 75% de los casos (muestra modelo, n = 1351). El resto de los datos fue dejado de lado para los propósitos de validación del modelo (muestra de prueba, n = 450). Una estrategia secundaria de validación fue utilizada usando el técnicas de validación cruzada (8) . Los autores utilizaron su modelo de regresión logística múltiple final para la validación cruzada, usándolo para obtener predicciones de mortalidad estimadas para cada niño (n = 1.801), basado en datos de todos los otros niños. Esto proporcionó una evaluación alterativa de la capacidad predictiva y calibración del modelo.
Para evaluar la capacidad predictiva del modelo, el área bajo la curva (AUC) (9) fue calculada usando la muestra modelo, muestra de prueba y la muestra total usando técnicas de validación cruzada. Se realizaron comparaciones con otro score de riesgo usando intervalos de confianza Bootstrap de diferencias en AUC (10). La calibración del modelo fue realizada usando el test Hosmer - Lemeshow (11). El análisis estadístico fue hecho usando Splus software (12) .
El modelo también fue utilizado para predecir complicaciones respiratorias y neurológicas relevantes intrahospitalarias. Se definió displasia broncopulmonar (DBP) como requerimiento de oxígeno a los 28 días de vida y cambios radiográficos crónicos (13) . La dependencia de oxígeno a las 36 semanas de edad postmenstrual se consideró un diagnóstico aparte. El diagnóstico de hemorragia intraventricular (HIV) fue hecho por ecografía craneal (ésta fue realizada al menos dos veces, en la primera semana de vida y a las 3-4 semanas de edad ) o por autopsia y fue clasificada de acuerdo a Papile y cols (14) . Leucomalacia Periventricular (PVL) fue diagnosticada por la presencia de ecolucencias focales en la ecografía craneal.
Resultados
La población del estudio incluyó 1.801 infantes. El peso de nacimiento promedio fue 1081 g y el promedio de edad gestacional 29.2 semanas. Los niños masculinos representan el 49.4% de la población total. La tasa de mortalidad promedio entre los diversos centros fue 26.7% con un rango de 9.7 a 51.8 % entre las unidades.
La tabla 1 muestra las estadísticas descriptivas que compara sobrevivientes y no sobrevivientes. En promedio, los sobrevivientes tienen más peso de nacimiento, edad gestacional y Apgar al 1-minuto que los no sobrevivientes . Además, los sobrevivientes tienen menos malformaciones congénitas y niños masculinos que los no sobrevivientes.
Tabla 1.- Comparación de las características de población entre niños MBPN sobrevivientes y no sobrevivientes en relación a factores usados para construir el score de riesgo NEOCOSUR.

La tabla 2 muestra las asociaciones univariables entre la mortalidad intrahospitalaria y las características prenatales y al ingreso del niño. El peso de nacimiento fue el mejor predictor de la mortalidad (AUC = 0.79), seguido por edad gestational (AUC = 0.77) y Apgar al 1-minuto con el mismo nivel de asociación (AUC = 0.77). Otros factores que fueron asociados significativamente con mortalidad intrahospitalaria fueron malformaciones congénitas ALT, uso de esteroide prenatal, edad materna y pequeño para edad gestacional.
Tabla 2 .- Asociación univariable entre mortalidad intrahospitalaria y características preingreso del niño.

Los efectos de cada una de las variables cuantitativas sobre mortalidad intrahospitalaria fueron analizados usando modelos de regresión logística aditiva generalizada . Todas las variables excepto edad materna mostraron efecto linear; por lo tanto, los datos fueron incorporados en el modelo de regresión logística múltiple como fueron medidos originalmente, sin romperlos en rangos de categoría.
Cuando se usó un modelo de regresión logística múltiple con un procedimiento paso a paso, seis factores fueron estadísticamente significativos en orden de significancia : peso de nacimiento, edad gestacional, Apgar al 1-minuto , malformación congénita ALT, administración de esteroides prenatal y sexo femenino del niño.
La Tabla 3 muestra los coeficientes del modelo de regresión logística múltiple , el error estándar y los odds ratios asociados. Estos coeficientes para las 6 variables seleccionadas en el contexto de un modelo logístico constituye el score NEOCOSUR y puede ser usado para calcular el riesgo predictivo de mortalidad del niño muy bajo peso de nacimiento. Un aumento de 100 g en el peso de nacimiento redujo el riesgo de mortalidad intrahospitalaria en 28%. Similarmente, la adición de 1 punto en el score de Apgar al 1-minuto redujo el riesgo en 23%. Una semana adicional de edad de gestación redujo el riesgo en 12%. Malformación congénita ALT tuvo el efecto de mayor tamaño entre todos los factores de riesgo ; ella aumenta el riesgo de mortalidad neonatal en más de 5 veces . Sin embargo, el riesgo atribuible a población debido a este factor debería ser relativamente pequeño debido a que las malformaciones congénitas ALT tienen una incidencia de solo 2.2%.
Table 3.- Factores seleccionados por un Modelo de regresión logística paso a paso que constituye el score NEOCOSUR para predicción de mortalidad del niño de MBPN.

La tabla 4 muestra la capacidad predictiva del score NEOCOSUR comparado a los score CRIB y NICHD usando el área bajo la curva del operador receptor (ROC) (AUC). El score
de riesgo NEOCOSUR tuvo una alta capacidad predictiva (AUC = 0.88) cuando fue evaluado en la muestra modelo (n = 1.351); sin embargo, su capacidad predictiva se redujo a 0.84 cuando fue usado para predecir mortalidad en la muestra de prueba (n = 450). Cuando el score NEOCOSUR fue evaluado en las dos muestras combinadas, el AUC fue 0.87. Como alternativa a la muestra de prueba, el score NEOCOSUR tuvo un AUC de 0.85 cuando se usaron técnicas de validación cruzada. El NEOCOSUR tuvo mejor capacidad predictiva para la mortalidad neonatal intrahospitalaria que los score CRIB y NICHD ó el peso de nacimiento solo.
Tabla 4 .- Capacidad predictiva de varios scores de riesgo de mortalidad neonatal usando el Area Bajo la curva ROC (AUC), incluyendo el score NEOCOSUR

El intervalo de confianza 95% para la diferencia entre el AUC del score NEOCOSUR, usando resultado de validación cruzada y el score CRIB fue 0.037 a 0.081 y entre el AUC del score NEOCOSUR y el score NICHD fue 0.019 a 0.040 . Con estos resultados, podemos concluir que el score NEOCOSUR es significativamente mejor predictor de mortalidad para esta población.
La figura 1 muestra la curva ROC resultante del score NEOCOSUR usando el score estimado con validación cruzada, el score NICHD y el score CRIB en todas las observaciones (n = 1.801). El score NEOCOSUR tuvo sensibilidad más alta que los scores NICHD y CRIB , para todos los niveles de especificidad.
Figura 1.- Curvas ROC para mortalidad intrahospitalaria para score de riesgo NEOCOSUR, CRIB y NICHD.

La figura 2 muestra la calidad del ajuste del score NEOCOSUR comparando la tasa de mortalidad observada versus la tasa de mortalidad estimada para cada grupo de deciles del score de riesgo. Un test de calidad de ajuste de Hosmer Lemeshow (chi cuadrado = 11.9, grado de freedom = 8, p = 0.85) confirma que el score NEOCOSUR evalúa la tasa de mortalidad bien en todos los niveles de riesgo.
Figura 2.- Tasa de mortalidad observada por decil de mortalidad predicha para niños MBPN (n = 1.801). La predicción de mortalidad fue calculada en base a un modelo de regresión logístico. Los puntos representan la tasa de mortalidad observada de los grupos deciles y la línea continua representa la calibración perfecta del modelo.

Cuando se usó el score NEOCOSUR para predecir complicaciones neurológicas y respiratorias intrahospitalarias entre los niños MBPN que sobreviven al alta hospitalaria (tabla 5), hubo buena capacidad predictiva para DBP a los 28 días (AUC = 0.81) y requerimiento de oxígeno a las 36 semanas de edad postmenstrual (AUC = 0.77), pero valores levemente más bajos para HIV grados III a IV (AUC = 0.72) y PVL (AUC = 0.69).
Cuando se comparó con los scores CRIB y NICHD, el score NEOCOSUR mostró capacidad predictiva similar para estas morbilidades.
Tabla 5.- Area bajo curva ROC para outcomes adversos entre niños sobrevivientes usando los scores NEOCOSUR, CRIB y NICHD.

Discusión
Hay una amplia variación en las tasas de mortalidad infantil de los niños MBPN en Sudamérica, como se reportó previamente (15). En la muestra reportada en este estudio nació en los centros de la Red NEOCOSUR que son afiliados a universidades y pertenecen a los sistemas público y privados de atención de salud, pero varían en tamaño, población asignada y recursos, servida, y los recursos, las tasas de mortalidad intrahospitalaria variaron desde 9.7 a 51.8%.
Los autores desarrollaron un nuevo modelo relativamente simple de predicción de la mortalidad para niños MBPN que podría ser exitosamente aplicado pronto después del nacimiento en un área tal como sudamérica que tiene diversos niveles de cuidado y riesgos de la población.
Los autores probaron para factores comúnmente disponibles que están presentes antes del score Apgar al 1 minuto, de modo que la predicción no fuera influenciada por intervenciones postnatales. Estudiaron varias variables que afectan la mortalidad y seleccionaron aquellas que eran más altamente asociadas con mortalidad.
El peso de nacimiento fue encontrado que era la variable más predictiva de mortalidad intrahospitalaria , seguido por edad gestacional y score Apgar al 1-minuto. Aunque el peso del nacimiento se reconoce como un determinante importante de la mortalidad neonatal, no es adecuado para explicar las grandes variaciones en mortalidad neonatal entre NICUs (16) de tal manera que se requiere un score de riesgo de mortalidad.
El modelo fue validado usando dos métodos alternativos. Primero, el modelo fue validado usando una muestra de prueba (test sample) no usada para el desarrollo del modelo y segundo , el modelo fue validado usando técnicas de validación cruzada, un método de remuestreo dejando una fuera. Ambos métodos mostraron consistentemente que el score NEOCOSUR tiene mejores capacidades predictivas que los scores CRIB y NICHD para mortalidad intrahospitalaria en esta población.
El modelo de los autores funcionó mejor que los modelos CRIB y NICHD. El CRIB fue desarrollado en el Reino Unido (n = 1300; peso de nacimiento menor 1.500 g) y publicado en 1993. Consiste en seis items , incluyendo peso de nacimiento, edad de gestacional, anomalías congénitas y tres mediciones fisiológicas obtenidas durante las primeras 12 horas de vida.
SNAP fue desarrollado en Estados Unidos (n = 1643 ingresos) y publicado en 1993, e incluye a recién nacidos de todos los pesos de nacimiento. Consiste de 34 items recolectados en las primeras 24 horas del ingreso. Los autores no pudieron comparar sus resultados con el score para Neonatal Acute Physiology (SNAP) porque no tenían toda la información sobre los items requeridos.
El score NICHD fue desarrollada en Estados Unidos (n = 3603 niños, 501 a 1500 gr) y también fue publicada en 1993. Consiste de cinco items incluyendo peso de nacimiento, pequeño para edad gestacional, raza negra, sexo masculino y score Apgar al 1-minuto.
Estos scores han sido replicados con buen a excelente funcionamiento en la mayoría de los reportes (17), aunque con ocasional pobre performance y no mejor que el peso de nacimiento sólo (18,19) . En años recientes, Pollack y cols. (20) han publicado modelos de riesgo en una cohorte de niños de MBPN de Washington, DC área.
Ellos encontraron que estos scores sobrepredijeron la mortalidad indicando una necesidad de recalibración frecuente. Una necesidad para revalidación periódica de los modelos de riesgo ha sido tratada en el pasado (17) . Han habido tambien otros esfuerzos en centros individuales para crear su propio score de riesgo (21).
El modelo del presente artículo difiere de los scores de riesgo CRIB y SNAP en que tiene más pocas variables y la información es recogida al ingreso, por lo tanto, es menos dependiente de intervenciones postnatales. En este aspecto, el modelo del presente artículo es similar al del NICHD. La diferencia principal entre el score NICHD y el score NEOCOSUR es que el score NICHD incluye raza que no se aplica en la población sudamericana y el modelo NEOCOSUR utiliza el score de Apgar como variable continua. El score NEOCOSUR es similar a otras scores de riesgo en proporcionar un pronóstico inicial de riesgo de mortalidad objetivo , pero no predice el riesgo para un niño individual y por tanto no puede ser utilizado para justificar la suspensión de la terapia o para limitar el cuidado.
Este nuevo modelo está primariamente diseñado para ser usado para predicción del riesgo de mortalidad, aunque los autores también encuentran que puede predecir complicaciones respiratorias y neurológicas graves intrahospitalarias. Sin embargo, este último hallazgo es esperable dado que la DBP y HIV se relacionan estrechamente con el peso de nacimiento y edad gestacional del niño. Su utilidad en predecir outcome a largo plazo no ha sido probado. Las pruebas del score CRIB sugieren que no es una herramienta confiable para predecir outcome del neurodesarrollo (22).
Una limitación obvia del de riesgo NECOSUR es que se solo se aplica a los niños de MBPN, bajo 1500 g de peso de nacimiento.
Los autores concluyen que este nuevo y relativamente simple score de riesgo de mortalidad neonatal del niño MBPN tiene buena performance predictiva en una población multicéntrica sudamericana y es una importante herramienta para propósitos de comparación entre NICUs. Basado en su simplicidad y buena performance en un escenario de población diversa , los autores especulan que este score de riesgo puede probar ser un mejor modelo para aplicación en países en vías de desarrollo.
Referencias
The International Network Group. The CRIB (clinical risk index for babies) score: a tool for assessing initial neonatal risk and comparing performance of neonatal intensive care units. Lancet 1993;342:193–8.
Horbar JD, Onstad L, Wright E, The National institute of Child Health and Human Development Neonatal Research Network. Predicting mortality risk for infants weighing 501 to 1500 grams at birth: The National Institutes of Health Neonatal Research Network report. Crit Care Med 1993; 21:12–7.
Hammermeister KE, Johnson R, Marshall G, Grover FL. Continuous assessment and improvement in quality of care. Ann Surg 1994;219: 281–290.
Marshall G, Shroyer ALW, Grover FL, Hammermeister KE. Time series monitor of outcomes: a new dimension of measuring quality of care. Med Care 1998;36:348–56.
Richardson DK, Gray JE, McCormick MC, et al. Score for neonatal acute physiology (SNAP): validation of a new physiology-based severity of illness. Pediatrics 1993;91:617–23.
Richardson DK, Corcoran JD, Escobar GJ, Lee SK, for the Canadian NICU Network. SNAP-II and SNAAPPE-II: simplified newborn illness severity and mortality risk scores. J Pediatr 2001;138:92–100.
Juez G, Lucero E, Ventura-Junca´ P, Gonzalez H, Tapia JL, Winter A. Crecimiento intrauterino en recie´n nacidos de clase media. Rev Chil Pediatr 1989;60:198–202.
Efron B. Estimating the error rate of a prediction rule: Improvement on cross-validation. J Am Statist Assoc 1983;78:316–31.
Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC) curve. Radiology 1982;143:29–36.
DiCiccio TJ, Efron B. More accurate confidence intervals in exponential families. Biometrika 1992;79:231–45.
Hosmer DW, Lemeshow S. Applied Logistic Regression, 2nd ed. New York, NY: John Wiley and Sons; 2000.
Chambers JM, Hastie TJ. Statistical Models in S. New York: Chapman & Hall; 1992.
Bancalari A, Abdenour G, Feller R, Gannon J. Bronchopulmonary dysplasia: clinical presentation. J Pediatr 1979;95:819–22.
Papile L, Bursten J. Incidence and evolution of subependimal and intraventricular hemorrhage. A study of infants with birth weights less than 1500 g. J Pediatr 1978;92:529–34.
Grupo Colaborativo NEOCOSUR. Very low birth weight infants outcome in 11 South American NICU’s. J Perinat 2002;22:2–7.
Richardson DK, Phibbs CS, Gray JE, et al. Birth weight and severity illness: independent predictors of neonatal mortality. Pediatrics 1993;91: 969–75.
Richardson DK, Tarnow-Mordi WO, Escobar GJ. Neonatal risk scoring systems. Clin Perinat 1998;25:591–611.
de Courcy-Wheeler RH, Wolfe RH, Fitzgerald A, et al. Use of the CRIB core in prediction of neonatal morbidity and mortality. Arch Dis Child Fetal Neonatal Ed 1996;74:F79–80.
Khanna R, Taneja V, Singh SK, et al. The clinical risk index for babies (CRIB) score in India. Indian J Pediatr 2002;69:957–60.
Pollack MM, Koch MA, Bartel DA, et al. A comparison of neonatal mortality risk prediction models in very low birth weight infants. Pediatrics 2000;105:1051–7.
Maier RF, Rey M, Metze BC, et al. Comparison of mortality risk: a score for very low birthweight infants. Arch Dis Child 1997;76:F146–51.
Lago P, Freato F, Bettiol T, et al. Is the CRIB score a valid tool in predicting neurodevelopmental outcome in extremely low birth weight infants? Biol Neonate 1999;76:220–7.