Validación de escalas de predicción de mortalidad en pacientes con enfermedad por coronavirus 2019 en el registro de pacientes rescate COVID19
Cite
Share this
Date
2021Other contributors
Metadata
Show full item recordDocuments PDF
Abstract
Introducción: La pandemia causada por la enfermedad por coronavirus 2019 (COVID-19) ha revelado la necesidad de optimizar los recursos en salud. Las herramientas que permiten diferenciar entre poblaciones con diferentes niveles de riesgo como las escalas o modelos de predicción, adquieren gran valor en este nuevo escenario. A la fecha se encuentran disponibles más de 50 escalas de pronóstico en COVID-19 pero la gran mayoría no han tenido procesos de validación externa y aún tienen un bajo potencial de generalización.
Objetivo: Evaluar el desempeño de al menos tres escalas de predicción de mortalidad, en términos de su capacidad de discriminación, calibración y potencial generalización a la práctica clínica, al aplicarlas en una cohorte nacional de pacientes con infección por SARS-COV2 (RESCATE COVID-19).
Metodología: A partir de una revisión sistemática viva de la literatura que contiene todas las escalas publicadas hasta mayo de 2020 y siguiendo un proceso estructurado, se eligieron las tres con mayor potencial de aplicación local. En cada una se realizó un proceso de caracterización de sus predictores (distribución, análisis bivariado y multivariado con regresión logística múltiple), evaluación de su capacidad de discriminación (área bajo las curvas ROC) y calibración (de manera gráfica y estadística: prueba de bondad de ajuste de Hosmer-Lemeshow, calibración en promedio “CITL”, pendiente de calibración). Además, se analizó el desempeño de los modelos utilizando sus puntajes o niveles de riesgo como variables independientes.
Resultados: Tras el proceso de selección resultaron dos estudios orientales (Zhang-China, Xie-China) y uno latinoamericano (Bello-México) como candidatos para su validación local. Los predictores propuestos por los modelos son en su mayoría variables sociodemográficas, antecedentes de comorbilidades, laboratorios generales y algunas derivadas de la atención clínica. Los modelos fueron evaluados en 1342 pacientes con diagnóstico confirmado de COVID-19 que hacen parte de la cohorte RESCATE COVID-19 (mortalidad 12.7%). Esta incluye pacientes atendidos en seis hospitales ubicados 3 diferentes ciudades de Colombia.
De los 7 predictores por la escala de Zhang-China solo 2 resultaron con OR significativo tras ser ajustados en un modelo de regresión logística multivariada (edad: OR 1.03; IC95% 1.01-1.06 y proteína C reactiva: OR: 1.07; IC95% 1.03 – 1.10). Su capacidad de discriminación resultó apenas aceptable (AUC: 0.78) y no demostró estar calibrada estadísticamente (HL p=0.002) ni en su evaluación gráfica. Al utilizar sus puntajes (calculados con una herramienta disponible en línea) y niveles de riesgo (según los puntos de corte propuestos) como variables predictoras, la escala tiene menor capacidad de discriminación (AUC: 0.73 y 0.67), persiste sin calibración estadística (HL p<0.05) y su evaluación gráfica empeora. Por su parte todos los predictores propuestos por la escala de Xie-China mostraron una asociación significativa con la mortalidad intrahospitalaria. Su capacidad de discriminación fue buena (AUC: 0.81) y sus predicciones se ajustaron a las observaciones de la cohorte (HL p=0.22). Sin embargo, no fue posible realizar un análisis de la escala de puntos basada en el nomograma que proponen sus autores. Se encontró que se trata de un sistema complejo de puntuación, con alta vulnerabilidad a errores de medición, demandante de tiempo y con poca probabilidad de aplicación a la práctica clínica diaria local. Cuatro de los 9 predictores de la escala Bello-México tuvieron medidas de asociación ajustadas significativas. Su capacidad de discriminación fue buena (AUC:0.80) y demostró calibración estadística (HL p=0.32) y gráfica. El sistema de puntuación como escala y los niveles de riesgo resultaron con mejor desempeño que el modelo (AUC: 0.87) y con muy buena calibración (HL p>0.05). Tras la evaluación de los puntos de corte para su aplicación clínica se eligió el umbral de 4 puntos en la escala para dividir entre alto y bajo riesgo (VPN: 98%, Sensibilidad del 90%).
Conclusiones:
La escala de Bello-México resultó tener muy buen desempeño al aplicarse a los pacientes con diagnóstico de COVID-19 de la cohorte RESCATE-COVID19. Su sistema de puntuación sencillo, con buena capacidad de discriminación entre pacientes de alto y bajo riesgo, ofrece predicciones calibradas de las probabilidades de mortalidad intrahospitalaria. Teniendo en cuenta la naturaleza de sus predictores se considera útil en escenarios de atención temprana de pacientes con diagnóstico o sospecha de la enfermedad. Con un punto de corte de 4 puntos la escala resulta útil como estrategia de tamización del pronóstico ya que puntajes menores tienen muy baja tasa de falsos negativos. Su uso puede informar mejor (aunque no reemplazar) la decisión clínica y optimizar la utilización de recursos. Es necesario evaluar su desempeño en otras poblaciones antes de generalizar su uso.
La escala de Zhang-China no logró un buen desempeño al aplicarse a la cohorte. El modelo de Xie-China, aunque prometedor por su desempeño, presenta una herramienta para cálculo de puntajes compleja, vulnerable de error de medición y demandante de recursos, que no la hace apta para su aplicación clínica local.
Lemb keywords
Ciencias médicas; Virus; Síndrome respiratorio agudo grave; Infecciones por coronavirus; Pacientes; Medición por escalasKeywords
Medical sciences; Health sciences; Validation; Mortality; Predictive models; Predictive scales; Pronostics; External validation; Discrimination; Calibration; Virus; Severe acute respiratory syndrome; Coronavirus infections; Patients; Measurement by scales
Comments