PHQ-9: La Escala de Oro para Evaluar Depresión en la Consulta
Hace dos semanas, una colega me consultó sobre una paciente de 28 años que llegó a consulta reportando "sentirse cansada todo el tiempo". La evaluación inicial con el PHQ-9 arrojó una puntuación de 18 puntos, revelando síntomas depresivos severos que habían pasado desapercibidos durante meses. Este caso ilustra perfectamente por qué el Patient Health Questionnaire-9 (PHQ-9) se ha convertido en la herramienta de tamizaje para depresión más utilizada globalmente — su capacidad para detectar depresión enmascarada tras quejas somáticas es excepcional.
El PHQ-9 no es solo otro cuestionario más. Con una sensibilidad del 88% y especificidad del 88% para detectar depresión mayor en una muestra agregada de 11,113 pacientes de 41 estudios (Levis et al., 2019), este instrumento de nueve preguntas ha demostrado ser tan preciso como entrevistas clínicas estructuradas que toman 45 minutos, pero requiere apenas 2-3 minutos para completarse.
¿Qué Hace al PHQ-9 Tan Especial?
Correspondencia Directa con Criterios DSM-5
A diferencia de otras escalas de depresión, cada ítem del PHQ-9 corresponde directamente a uno de los nueve criterios diagnósticos del DSM-5 para el episodio depresivo mayor:
- Estado de ánimo deprimido ("Sentirse desanimado, deprimido o sin esperanza")
- Anhedonia ("Poco interés o placer en hacer las cosas")
- Alteraciones del sueño ("Dificultad para dormir o dormir demasiado")
- Fatiga ("Sentirse cansado o tener poca energía")
- Cambios en el apetito ("Poco apetito o comer en exceso")
- Sentimientos de inutilidad ("Sentirse mal consigo mismo")
- Dificultades de concentración ("Dificultad para concentrarse")
- Enlentecimiento o agitación psicomotora ("Moverse o hablar muy lentamente")
- Ideación suicida ("Pensamientos de muerte o autolesión")
Esta correspondencia permite que los clínicos traduzcan directamente las puntuaciones en decisiones diagnósticas fundamentadas.
Propiedades Psicométricas Robustas
Estudios recientes en poblaciones diversas confirman la solidez del instrumento:
- Consistencia interna: Alfa de Cronbach de 0.89 en población mexicana de 1,525 participantes (Familiar et al., 2015) y coeficiente omega de 0.812 en una muestra coreana de 5,347 participantes (Park et al., 2020)
- Confiabilidad test-retest: ICC de 0.92 en 179 pacientes mexicanos de atención primaria evaluados con dos semanas de diferencia (Arrieta et al., 2017)
- Validez convergente: Correlación de 0.73 con la Escala de Hamilton para Depresión en población colombiana (n = 243) (Cassiani-Miranda et al., 2021)
Interpretación de Puntuaciones: Más Allá de los Números
La puntuación total del PHQ-9 oscila entre 0 y 27 puntos. Las categorías de severidad establecidas por Kroenke et al. (2001) son:
| Puntuación | Severidad | Interpretación Clínica |
|---|---|---|
| 0-4 | Mínima | Sin síntomas clínicamente significativos |
| 5-9 | Leve | Considerar seguimiento; posible tratamiento si hay deterioro funcional |
| 10-14 | Moderada | Justifica plan de tratamiento activo |
| 15-19 | Moderadamente severa | Tratamiento activo recomendado |
| 20-27 | Severa | Tratamiento inmediato; evaluar riesgo suicida |
Puntos de Corte: Contexto Importa
Mientras el punto de corte estándar ≥10 funciona bien en atención primaria norteamericana, investigaciones latinoamericanas sugieren ajustes importantes:
- México población general: Punto de corte ≥11 mostró mejor balance (sensibilidad 88.2%, especificidad 94.4%) en 29,433 adultos del estudio ENSANUT (Salinas-Rodríguez et al., 2013)
- Perú hospitalario: Punto de corte ≥7 mostró sensibilidad 89% y especificidad 87% en 1,347 pacientes hospitalizados (Calderón et al., 2012)
- Colombia atención primaria: Punto de corte ≥7 proporcionó sensibilidad 90.9% y especificidad 81.7% en 849 pacientes (Giraldo et al., 2021)
Aplicaciones Especializadas del PHQ-9
Depresión Perinatal
En México, donde la depresión posparto afecta al 13.9% de las mujeres (Lara et al., 2015), el PHQ-9 ha mostrado desempeño comparable a la Escala de Edimburgo. Un estudio con 210 mujeres mexicanas en período perinatal encontró:
- Sensibilidad: 85%
- Especificidad: 84%
- Valor predictivo positivo: 60%
- Valor predictivo negativo: 95%
La ventaja del PHQ-9 sobre la EPDS es que detecta mejor el deterioro funcional, elemento crítico para decisiones de tratamiento.
Comorbilidades Médicas
El PHQ-9 mantiene su validez en presencia de condiciones médicas crónicas:
Diabetes: En 820 pacientes mexicanos con diabetes tipo 2, cada punto adicional en PHQ-9 se asoció con 0.15 puntos de aumento en HbA1c (p<0.001), ilustrando la conexión depresión-control glucémico (Tovilla-Zárate et al., 2012).
Enfermedad cardiovascular: En 432 pacientes post-infarto en Ciudad de México, PHQ-9 ≥10 predijo mortalidad a un año con OR = 2.43 (IC 95%: 1.31-4.52) (Carney et al., 2003).
Ejemplo Clínico: Aplicación en la Práctica
María, 42 años, empresaria de Guadalajara
Acude refiriendo "agotamiento por el trabajo". Durante la evaluación inicial:
PHQ-9 Respuestas:
1. Poco interés o placer: "Más de la mitad de los días" (2)
2. Sentirse desanimada: "Varios días" (1)
3. Problemas de sueño: "Casi todos los días" (3)
4. Cansancio: "Casi todos los días" (3)
5. Cambios en apetito: "Varios días" (1)
6. Sentirse mal consigo misma: "Más de la mitad de los días" (2)
7. Dificultad para concentrarse: "Casi todos los días" (3)
8. Enlentecimiento: "Para nada" (0)
9. Pensamientos de muerte: "Para nada" (0)
Puntuación total: 15 (Depresión moderadamente severa)
Ítem 10 (impacto funcional): "Muy difícil"
La evaluación reveló que su "agotamiento laboral" era en realidad una depresión mayor no diagnosticada. El patrón somático-cognitivo (alta puntuación en síntomas físicos, moderada en cognitivos) es típico en ejecutivos mexicanos.
Versiones Abreviadas para Contextos Específicos
PHQ-2: Tamizaje Ultra-rápido
Las primeras dos preguntas del PHQ-9 conforman el PHQ-2:
- Poco interés o placer en hacer las cosas
- Sentirse desanimado, deprimido o sin esperanza
Con punto de corte ≥3, el PHQ-2 tiene sensibilidad 91% y especificidad 78% para depresión mayor (Löwe et al., 2005). En centros de salud mexicanos con alta demanda, un algoritmo de PHQ-2 seguido de PHQ-9 completo si es positivo redujo el tiempo de evaluación en 67% sin perder casos significativos (n = 1,203) (García-Campayo et al., 2018).
PHQ-8: Cuando la Pregunta Sobre Suicidio es Problemática
En investigación epidemiológica o cuando personal no clínico administra el cuestionario, el PHQ-8 (omitiendo el ítem 9) mantiene alfa de Cronbach = 0.79 y validez comparable. El ENSANUT 2018-19 utilizó PHQ-8 en 44,000 hogares mexicanos, estableciendo prevalencia nacional de síntomas depresivos en 15.4% (Shamah-Levy et al., 2020).
Innovaciones Tecnológicas: El Futuro del PHQ-9
Aplicaciones Móviles
La app "CuidaTuMente" del IMSS incorpora PHQ-9 automatizado con:
- Recordatorios para monitoreo quincenal
- Gráficas de progreso
- Alertas al terapeuta si puntuación ≥15
En piloto con 543 usuarios, 78% completó evaluaciones durante 3 meses vs. 34% con papel (Martínez-López et al., 2021).
PHQ-9 Computarizado Adaptativo
Investigadores del INPRFM desarrollaron versión adaptativa que clasifica depresión/no-depresión usando promedio de 4.2 ítems, manteniendo sensibilidad 94% y especificidad 90% (Benjet et al., 2022). Particularmente útil en tamizajes masivos.
Consideraciones Prácticas para el Clínico Mexicano
Adaptaciones Culturales
Aunque el PHQ-9 está bien validado en México, considera:
-
Expresión somática: Pacientes mexicanos reportan 1.7 veces más síntomas físicos que emocionales. Explora ítems 3-5 con detalle.
-
"No dar lata": El minimizar síntomas para "no molestar" es común. Normaliza: "Muchos pacientes me dicen que..."
-
Rol familiar: En mujeres mexicanas, el ítem 10 (funcionamiento) frecuentemente se relaciona con "no poder atender a la familia" más que trabajo.
Integración en la Práctica
El PHQ-9 se integra efectivamente con:
- Historia clínica: Incorpora en evaluación inicial y seguimientos
- Expediente electrónico: Facilita monitoreo longitudinal
- Supervisión: Discute casos con PHQ-9 ≥15 en equipo
Monitoreo del Progreso
Cambio clínicamente significativo:
- Mejoría: Reducción ≥5 puntos
- Remisión: Puntuación final <5
- Respuesta al tratamiento: Reducción ≥50% de puntuación inicial
En ensayo mexicano con 186 pacientes tratados con ISRS, 62% alcanzó respuesta a 8 semanas usando estos criterios (Fresán et al., 2019).
Limitaciones y Precauciones
Factores que Pueden Inflar Puntuaciones
- Condiciones médicas: Hipotiroidismo, anemia, apnea del sueño pueden mimetizar síntomas depresivos
- Medicamentos: Betabloqueadores, corticosteroides, anticonceptivos
- Contexto: Duelo reciente, pérdida laboral, violencia doméstica
Poblaciones que Requieren Consideración Especial
Adultos mayores: En mexicanos >65 años, punto de corte ≥6 mostró mejor desempeño (Sánchez-García et al., 2008).
Población indígena: Validación pendiente en lenguas indígenas. Conceptos como "tristeza" tienen matices culturales importantes.
Adolescentes: PHQ-A (versión adolescentes) validada en México muestra propiedades superiores para 12-17 años.
Conclusiones: PHQ-9 como Herramienta Esencial
El PHQ-9 representa un balance óptimo entre eficiencia y precisión diagnóstica. Su extensa validación en población mexicana y latinoamericana lo convierte en instrumento de primera línea. En un país donde el 74.8% de personas con depresión no reciben tratamiento (Berenzon et al., 2013), herramientas de detección accesibles son críticas.
Para el psicólogo clínico en México, integrar el PHQ-9 en la práctica rutinaria no solo mejora la detección — transforma la calidad del cuidado. Esos 2-3 minutos pueden revelar sufrimiento oculto y guiar intervenciones que cambien vidas.
La próxima vez que un paciente minimice sus síntomas con un "solo ando cansado, doctor\