Ciencias Psicológicas; v19(2)
julio-diciembre 2025
10.22235/cp.v19i2.4481
Propiedades psicométricas del Patient Health Questionnaire-4 en una muestra de adultos de Ecuador
Psychometric Properties of the Patient Health Questionnaire-4 in a Sample of Adults from Ecuador
Propriedades psicométricas do Patient Health Questionnaire-4 em uma amostra de adultos do Equador
Evelyn Cuesta-Andaluz1 ORCID 0000-0002-5173-2514
Rodrigo Moreta-Herrera2 ORCID 0000-0003-0134-5927
Adriana Moya-Solís3 ORCID 0000-0002-3744-927X
Nazury Santillán-García4 ORCID 0000-0003-1117-2177
Esteban Moreno-Montero5 ORCID 0000-0002-3477-9417
1 Universidad Internacional de La Rioja, España
2 Pontificia Universidad Católica del Ecuador, Ecuador, [email protected]
3 Pontificia Universidad Católica del Ecuador, Ecuador
4 Universidad Estatal de Milagro, Ecuador
5 Universidad de La Coruña, España
Resumen:
Objetivo: Analizar las propiedades
psicométricas del Patient Health Questionnaire-4 (PHQ-4) en una muestra de
adultos de Ecuador. 
Método: Estudio de carácter
psicométrico en el que se analizan la validez factorial, la equivalencia de
medida diferenciada por el género y la consistencia interna del instrumento. 
Participantes: 406 adultos
ecuatorianos, el 68.47 % corresponden a mujeres, con edades entre 18 y 59 años
(M = 27.43; DE = 8.20). 
Resultados: Se confirma el
modelo oblicuo de dos factores del PHQ, con las dimensiones de depresión y
ansiedad. Además, la medida es equivalente a nivel escalar a partir del género.
La consistencia interna es adecuada y presenta una validez divergente con
medidas de bienestar general. 
Conclusión: El PHQ-4 es un
instrumento válido y confiable para la evaluación rápida de la ansiedad y la
depresión en adultos de Ecuador.
Palabras clave: ansiedad; depresión; equivalencia de medida; fiabilidad; validez.
Abstract:
Objective: To analyze the psychometric
properties of the Patient Health Questionnaire-4 (PHQ-4) in a sample of
Ecuadorian adults. 
Method: Psychometric study in which factorial validity, measurement
equivalence differentiated by gender and internal consistency of the instrument
are analyzed. 
Participants: 406 Ecuadorian adults, 68.47 % women, aged between 18 and
59 years (M = 27.43; SD = 8.20). 
Results: The oblique two-factor model of the PHQ is confirmed, with the
dimensions of depression and anxiety. Furthermore, the measure is equivalent at
the scalar level based on gender. Internal consistency is adequate and presents
divergent validity with measures of general well-being. 
Conclusion: The PHQ-4 is a valid and reliable instrument for rapid
assessment of anxiety and depression in Ecuadorian adults.
Keywords: anxiety; depression; measurement equivalence; reliability; validity.
Resumo:
Objetivo: Analisar as propriedades psicométricas do Patient Health Questionnaire-4 (PHQ-4) em uma amostra de adultos equatorianos.
Método: Estudo psicométrico no qual se
analisa a validade fatorial, a equivalência de medida diferenciada por gênero e
a consistência interna do instrumento. 
Participantes: 406 adultos equatorianos, 68,47 % mulheres, com idades
entre 18 e 59 anos (M = 27,43; DP = 8,20). 
Resultados: Confirma-se o modelo bifatorial oblíquo do PHQ, com as
dimensões depressão e ansiedade. Além disso, a medida mostrou-se equivalente ao
nível escalar de acordo com o gênero. A consistência interna é adequada e
apresenta validade divergente em relação às medidas de bem-estar geral. 
Conclusão: O PHQ-4 é um instrumento válido e confiável para a avaliação
rápida de ansiedade e depressão em adultos equatorianos.
Palavras-chave: ansiedade; depressão; equivalência de medida; confiabilidade; validade.
Recibido: 15/02/2025
Aceptado: 22/09/2025
La salud mental se define como un estado de bienestar psicológico y social que permite a las personas manejar el estrés cotidiano, mantener relaciones significativas y tomar decisiones acertadas (World Health Organization (WHO), 2022). Es un componente esencial de la salud general y de la calidad de vida, cuyo déficit puede dar lugar a alteraciones y trastornos mentales (Cova, 2022). Entre estos aspectos, la ansiedad y la depresión destacan por su prevalencia e impacto negativo en la vida de los individuos (Fajkowska et al., 2018; Moreta-Herrera et al., 2024), por lo que es relevante su estudio e intervención.
Por un lado, la depresión está caracterizada por síntomas de tristeza persistente, pérdida de interés o placer en las actividades, fatiga constante, cambios en el apetito, dificultades de concentración e ideas recurrentes de muerte o suicidio y otros (American Psychiatric Association (APA), 2014). Sus causas son multifactoriales e incluyen componentes genéticos, biológicos, psicológicos y ambientales (Rutakumwa et al., 2023). A nivel global, más de 280 millones de personas padecen esta condición, lo que la convierte en una de las principales causas de discapacidad social (Yildirim et al., 2022), con diferencias de género, ya que las mujeres suelen reportar frecuentemente más depresión que los hombres (Hyde & Mezulis, 2020; McGuinness et al., 2012). En América Latina esta condición afecta al 22 % de la población (Huang et al., 2023), mientras que en Ecuador se estima que alrededor del 10 % presenta estos síntomas (Lapo-Talledo et al., 2025).
Por otro lado, la ansiedad se manifiesta como un estado de preocupación excesiva, inquietud y síntomas neurovegetativos que incluyen palpitaciones, sudoración, tensión muscular y otros (APA, 2014). Al igual que la depresión, sus causas son multifactoriales, e incluyen predisposiciones genéticas y experiencias de vida estresantes (Chen, 2023). También se presentan diferencias según el género; las mujeres sufren más de esta condición que los hombres (Asher & Aderka, 2018; Gao et al., 2020). A nivel mundial, los trastornos de ansiedad afectan aproximadamente al 4 % de la población en condición de trastorno específico (Anxiety and Depression Association of America, 2023), mientras que en Ecuador la presencia sintomatológica se encuentra en el 25 %, y se ha notado un incremento a raíz de la pandemia de la covid-19 (Hermosa-Bosano et al., 2021; Sánchez-Vélez & Moreta-Herrera, 2022).
Debido a la alta incidencia de estos síntomas en la población general que probablemente requieren asistencia profesional y, ante las limitaciones y dificultades en el acceso rápido y oportuno a la atención sanitaria pública (Berry et al., 2020), el proceso de evaluación y diagnóstico es necesario. En este camino, la función de la investigación en psicometría es relevante, pues no solo debe generar y adaptar medidas a distintos contextos y situaciones, sino que debe permitir valoraciones precisas de atributos psíquicos de prioridad sanitaria, así como rápidas y eficientes en cuanto a la disponibilidad de recursos (personal, tiempo, costos, otros). En el caso de Ecuador, existe una marcada limitación de medidas disponibles para la valoración psicológica y esto incluye las condiciones de ansiedad y depresión.
Medidas de evaluación de la depresión y la ansiedad
Para evaluar la ansiedad y la depresión, se han desarrollado herramientas con distintos enfoques evaluatorios alrededor del mundo. Entre las medidas especializadas más empleadas, se encuentran el Inventario de Ansiedad de Beck (BAI; Beck et al., 1988), la Escala de Ansiedad Rasgo-Estado (STAI; Spielberger et al., 1970), el Inventario de Depresión de Beck (BDI; Beck et al., 1996), la Escala de Autoevaluación de la Depresión (SDS); Zung, 1986). También destacan medidas de evaluación múltiple de condiciones de alteración mental como el Cuestionario de Salud General (GHQ-28; Goldberg, 1972), de la que se cuenta con una versión adaptada de 28 ítems en Ecuador (GHQ-28; Moreta-Herrera et al., 2021), la escala de los 90 síntomas (SCL-90 R; Derogatis et al., 1973) y la escala de 21 ítems de ansiedad, depresión y estrés (DASS-21; Lovibond & Lovibond, 1995). Todas ellas fueron desarrolladas para procesos de screening rápido y segmentación breve de los individuos en atención primaria para una mejor clasificación de los pacientes con necesidades de atención especializada.
Entre el grupo de medidas que evalúan la ansiedad y la depresión en conjunto, se encuentra el Cuestionario de Salud del Paciente (PHQ; Spitzer et al., 1999), inicialmente desarrollado en inglés en formato de autoinforme con 15 ítems. Este instrumento busca identificar criterios de depresión y ansiedad en atención primaria, no para diagnósticos específicos, sino para la derivación posterior. Su versatilidad ha hecho que sea ampliamente usado alrededor del mundo. A partir de esta propuesta, se han desarrollado versiones cortas, como el PHQ-9 (Kroenke et al., 2001) y el PHQ-4 (Kroenke et al., 2009), para agilizar el proceso de identificación de los indicadores de alteración.
El PHQ-4 es la versión ultrabreve del PHQ y consta de cuatro ítems. Dos de ellos están relacionados con la ansiedad (GAD-2) y dos con la depresión (PHQ-2). Esto facilita su aplicación en diferentes contextos clínicos y poblacionales. Sus propiedades psicométricas han sido ampliamente probadas y validadas en diversos estudios internacionales con adultos en Austria, Croacia, Georgia, Alemania, Lituania, Portugal y Suecia (Kazlauskas et al., 2023), Grecia (Christodoulaki et al., 2022), Polonia (Larionow & Mudło-Głagolska, 2023), Filipinas (Mendoza et al., 2024), en el que se verifica, además, la equivalencia de medida (EM) basada en el género y otros. En el contexto hispanohablante también existen estudios de validación y adaptación a la población latinoamericana en Estados Unidos (Mills et al., 2015), Paraguay (Caycho-Rodríguez et al., 2024) y Perú (Carranza Esteban et al., 2024). En el caso de Ecuador, se reportó el análisis de sus propiedades psicométricas y validación, pero con muestras de estudiantes universitarios (Guerra et al., 2022).
En los estudios revisados, en general, se confirma la estructura factorial de dos factores correlacionados (oblicuo) de la medida, además de ratificar la consistencia interna en sus ítems según cada factor como adecuada. Además, se mantienen procesos de validez convergente con medidas de bienestar, aceptación y compromiso, y divergente con medidas de estrés, ansiedad y depresión y, finalmente, la EM basada en el género de la medida.
El presente estudio
En la pospandemia derivada de la covid-19, tanto en la región (Moreno-Montero et al., 2025) como en Ecuador, los niveles de ansiedad y depresión se han visto incrementados (Moreta-Herrera et al., 2025; Sánchez-Vélez & Moreta-Herrera, 2022), lo que hace que la presión sobre el sistema público sanitario aumente y limite los procesos de atención de los pacientes potenciales. De este modo, se vuelve necesario contar con herramientas de screening rápido como el PHQ-4 que se encuentren validadas y calibradas para la población general y ajustadas a esta nueva realidad para permitir su uso en procesos eficientes de cribado. Por otra parte, desde un contexto psicométrico, si bien existe un estudio en una muestra ecuatoriana del PHQ-4 que puede servir como referencia (Guerra et al., 2022), es necesario señalar que los análisis que emplean el Análisis Factorial Confirmatorio (AFC) no se llevaron a cabo con estimaciones robustas, pese a la naturaleza ordinal de los ítems. Esto puede distorsionar los criterios finales sobre los ajustes y la idoneidad de la medida, al no garantizar una validez interna adecuada del estudio, lo que puede repercutir en un sesgo de medida (Li, 2016) e incrementar la posibilidad de cometer error de tipo I. Por ello, es necesario verificar las propiedades psicométricas como la validez factorial, la EM diferenciada por género, debido a que la evidencia sugiere diferencias de género en la ansiedad y la depresión (Asher & Aderka, 2018; Gao et al., 2020; Hyde & Mezulis, 2020; McGuinness et al., 2012), y la validez basada en la relación con otras variables asociadas a través del uso de estimadores robustos, en especial con medidas como el bienestar, dado la estrecha cercanía que suele tener con las condiciones de alteración mental (Kazlauskas et al., 2023; Mendoza et al., 2024); así como la consistencia interna para minimizar cualquier tipo de elemento que cuestione la precisión de la medida.
Por lo tanto, los objetivos de este estudio son: (1) evaluar la dimensionalidad del PHQ-4 en una muestra de adultos de Ecuador; (2) determinar su consistencia interna; (3) analizar la ME basada en el género; (4) explorar la validez basada en la relación con el bienestar psicológico. De esta manera, se plantea que el PHQ-4 presentará una validez interna adecuada (H1), una consistencia interna satisfactoria (H2), una ME basada en el género adecuada (H3) y una relación significativa con el constructo de bienestar psicológico (H4).
Método
Diseño
El presente estudio adoptó un enfoque cuantitativo, de tipo instrumental (Ato et al., 2013), en el que se busca confirmar la estructura interna del PHQ-4, así como la fiabilidad basada en la consistencia interna, la equivalencia de medición (EM) diferenciada por género y la validez basada en la relación con otras variables en una muestra de adultos de Ecuador.
Participantes
El estudio incluyó a 406 ecuatorianos (68.47 % mujeres), con edades entre 18 y 59 años (M = 27.43; DE = 8.20); 81.42 % reside en zonas urbanas y 18.58 % en zonas rurales. El 51.97 % son estudiantes universitarios, mientras que el otro 48.03 % corresponde a población general; el nivel educativo de la muestra total corresponde a estudios universitarios en un 73.89 %. La mayoría de los participantes son solteros (74.87 %).
Fueron seleccionados mediante un muestreo no probabilístico con un método de encadenamiento o bola de nieve (para la difusión de los resultados) y de conveniencia con criterios de inclusión: (1) participación voluntaria; (2) ser mayor de 18 años; (3) nivel educativo acorde a la edad para garantizar la comprensión de los instrumentos. Los criterios de exclusión incluyeron: (1) presencia de discapacidad intelectual; (2) efectos de sustancias o fármacos que afecten la conciencia; (3) falta de dominio del idioma castellano.
Instrumentos
Patient Health Questionnaire-4 (PHQ-4; Kroenke et al., 2009). Herramienta breve diseñada para evaluar los síntomas de la ansiedad y la depresión en contextos preclínicos y de investigación. Consta de cuatro ítems divididos en dos subescalas: el PHQ-2 y el GAD-2, que se responden en una escala de tipo Likert de cuatro opciones que van desde Nunca (0) hasta Casi todos los días (3). En cuanto a la interpretación de los puntajes, la suma total de los ítems refleja la intensidad de los síntomas generales, mientras que las subescalas permiten identificar el nivel de ansiedad o depresión por separado. A mayor puntaje, se observa una mayor severidad de los síntomas. Sobre las propiedades psicométricas, en la versión original se reportan valores de fiabilidad α = .86 y .89 para el PHQ2 y el GAD-2, respectivamente; mientras que en la muestra ecuatoriana se reportan valores de ω = .780 para el PHQ-2 y ω = .838 para el GAD-2 (Guerra et al., 2022).
World Health Organization Five Well-Being Index (WHO-5; WHO, 2024) en la versión traducida al castellano (Simancas-Pallares et al., 2016). La escala incluye cinco ítems; puntuaciones más altas representan niveles más altos de bienestar percibido en las últimas dos semanas. Los ítems se califican en una escala de tipo Likert que va desde En ningún momento (0) a Todo el tiempo (5), con un rango de puntuación total de 0 a 25 puntos. En cuanto a las propiedades psicométricas, el instrumento presenta un alfa de Cronbach de α = .852 equivalente a adecuada (Simancas-Pallares et al., 2016).
Procedimientos
Con el objetivo de reclutar un número significativo de participantes, se diseñó una encuesta en la plataforma Google Forms que se difundió en diversos centros de educación superior de Ecuador. Los participantes potenciales recibieron información detallada sobre los objetivos, las medidas de seguridad, el anonimato de las respuestas, la participación voluntaria y la posibilidad de abandonar la evaluación sin repercusiones. Las personas que aceptaron participar completaron la evaluación en un tiempo de 15 minutos aproximadamente. Concluida esta instancia, se les solicitó la difusión del enlace de evaluación entre sus contactos personales para incrementar el radio de acceso a la población, lo que permitió evaluar también población general. Tras este proceso, se depuró y se sistematizó la información de forma digital para proceder a la gestión estadística, la formulación de resultados, el contraste de hipótesis y la elaboración de los informes de investigación.
Los aspectos de carácter ético en el estudio adhirieron a los criterios y normas éticas para la investigación con seres humanos dada por la Declaración de Helsinki. El proyecto del que deriva este estudio fue aprobado por el comité de revisión institucional de la Pontificia Universidad Católica del Ecuador Sede Ambato (Pucesa).
Análisis de datos
La gestión estadística de los resultados se dividió en cinco bloques. En el primero, se realizó un análisis preliminar de los ítems del PHQ-4 empleando medidas como la media aritmética (M), la desviación estándar (DE), la asimetría (g1) y la curtosis (g2). Además, se evaluó la normalidad univariante que se cumple si g1 y g2 están dentro de ~1.5 (Ferrando & Anguiano-Carrasco, 2010). Finalmente, la normalidad multivariante se analizó con la prueba de Mardia (1970), considerando que cuando no hay significancia (p > .05) en g1 y g2, es evidencia de normalidad multivariante.
El segundo bloque corresponde al AFC a partir de una matriz de correlaciones policóricas empleando la estimación de Mínimos Cuadrados Ponderados Diagonalmente (DWLS), dada la ausencia de normalidad multivariada y la naturaleza categórica de los ítems (Li et al., 2022; Moreta-Herrera et al., 2025). En esta fase, se analizaron tres modelos de ajuste: (1) unidimensional; (2) oblicuo de dos factores; y (3) jerárquico con dos factores de primer orden y uno de segundo. Para el ajuste del modelo oblicuo, según lo propuesto por Kroenke et al. (2009), se consideraron siete índices: el Chi cuadrado (χ²), el Chi cuadrado normado (χ²/gl), el Índice de Ajuste Comparativo (CFI), el Índice de Tucker-Lewis (TLI), el Residuo Cuadrático Medio Estandarizado (SRMR), el Error Cuadrático Medio de Aproximación (RMSEA) y las cargas factoriales (λ) de los ítems. Se considera que el ajuste es adecuado cuando el valor del χ² es p > .05 o el χ²/gl es menor a 4; el CFI y el TLI es mayor a .95, y el SRMR y el RMSEA es menor a .06 (aunque se acepta tolerancias de .08) (Browne & Cudeck, 1992; Byrne, 2008; Wolf et al., 2013; Yang-Wallentin et al., 2010). Finalmente, las cargas factoriales (λ) de los ítems se consideraron adecuadas si superaron el valor de λ > .40 (Dominguez-Lara, 2018).
En el tercer bloque se analiza la EM del PHQ-4 basada en el género con un AFC multigrupo (AFC-MG) con estimación DWLS, para descartar diferencias entre grupos en la estructura interna (Asparouhov & Muthén, 2014; Moreta-Herrera et al., 2022). En este proceso se impusieron restricciones en las saturaciones (métrica), los interceptos (escalar o fuerte) y los residuales (estricta) para determinar si los cambios en los índices de ajuste (χ², CFI y RMSEA) eran significativos. Se asume la EM si el cambio (Δ) en χ² no era significativo (p > .05), aunque debido al tamaño de la muestra esto puede no cumplirse (Luong & Flake, 2023). Además, se exigió que ΔCFI ≤ .015 y ΔRMSEA ≤ .01 para cada momento de restricción (Rutkowski & Svetina, 2017).
En el tercer bloque se evaluó la consistencia interna mediante el coeficiente Alfa (α). Aunque el coeficiente Omega de McDonald (ω) ha sido reconocido como una métrica más robusta para evaluar la confiabilidad de las escalas, especialmente en modelos con cargas factoriales heterogéneas, su cálculo requiere modelos bien identificados (Şimşek & Noyan, 2013). En este caso, debido a la estructura oblicua del PHQ-4 y los problemas asociados con la estimación del ω en dimensiones individuales, se optó por utilizar α como medida principal de confiabilidad.
Los valores de referencia generalmente aceptados para interpretar la consistencia interna indican que un α ≥ .70 se considera aceptable. Cabe señalar que, aunque con precaución, el análisis de fiabilidad con dos ítems por factor es plenamente viable cuando las correlaciones entre los ítems sean alta o muy altas, siendo recomendables a partir de .60 (Lapo-Talledo et al., 2025). Como se desglosa la consistencia interna por grupos, se presentan también las diferencias de la fiabilidad entre grupos; para ello se restan tanto los valores del coeficiente (Δα) como de los intervalos de confianza (IC). Se estima que existen diferencias en la consistencia interna entre grupos cuando los valores de los IC no incluyen al 0.
Finalmente, el quinto bloque abordó la validez basada en la relación con otras variables mediante el Modelamiento con Ecuaciones Estructurales (SEM), identificando covarianzas latentes entre el PHQ-4 y una medida de bienestar (WHO-5). Se esperan relaciones superiores a ρ > .20 con índices de ajuste similares a los del AFC en el modelo de ajuste general.
Cabe señalar que los análisis estadísticos fueron realizados mediante el lenguaje de programación R, versión 4.3.1 (R Core Team, 2024) y los paquetes utilizados fueron lavaan para el AFC, semTools para la EM, MNV para la normalidad multivariada y MBESS para los índices de fiabilidad.
Resultados
Análisis preliminar de los ítems
La Tabla 1 presenta el análisis preliminar de los ítems que conforman el PHQ-4. Los promedios de los ítems oscilaron entre M(ítem3) = 0.66; DE = 0.80 y M(ítem1) = 0.77; SD = 0.79. En cuanto a los índices de distribución, se encuentran entre 0.93 y 1.06 para la g1 y entre 0.47 y 0.68 para la g2, lo que sugiere que las distribuciones de los ítems presentan una leve desviación de la normalidad. Adicionalmente, los resultados del análisis de la normalidad multivariante indican valores significativos de la prueba en g1 y g2, confirmando el incumplimiento de los supuestos de normalidad multivariada. Finalmente, la matriz de correlaciones evidencia asociaciones positivas entre los ítems, con coeficientes que varían entre .528 y .632, lo que respalda la coherencia interna del instrumento. Debido a estos hallazgos, resulta fundamental aplicar estimadores robustos para los análisis factoriales posteriores, con el fin de garantizar resultados válidos y confiables.
Tabla 1: Análisis preliminar de los ítems del PHQ-4

Nota. M: media; DE: desviación estándar; g1: asimetría; g2: curtosis.
*** p < .001
Análisis factorial confirmatorio
La Tabla 2 presenta los resultados de los AFC del PHQ-4 evaluando los distintos modelos de ajuste. Tanto el modelo oblicuo como el jerárquico presentaron los mejores ajustes con valores casi máximos. De acuerdo con la literatura previa, el modelo oblicuo es utilizado con frecuencia en estudios psicométricos del PHQ-4, ya que asume una estructura de dos factores correlacionados que refleja las dimensiones de la depresión y la ansiedad. Este modelo es congruente con los resultados encontrados, lo que destaca su superioridad en términos de parsimonia y ajuste teórico. Por lo tanto, se concluye que el modelo oblicuo es el más apropiado para describir la estructura factorial del PHQ-4 en la muestra estudiada.
Tabla 2: Análisis factorial confirmatorio del PHQ-4

Nota. χ2: chi-cuadrado; gl: grados de libertad; χ2/gl: chi-cuadrado normado; CFI: Índice de Ajuste Comparativo; TLI: Índice de Tucker-Lewis; SRMR: Residuo Cuadrático Medio Estandarizado; RMSEA: Error Cuadrático Medio de Aproximación.
++ Dos factores de primer orden y un factor de segundo orden.
Adicionalmente, como se aprecia en la Figura 1, el modelo oblicuo se destaca como el más idóneo para la configuración del PHQ-4, evidenciando resultados que validan su adecuado ajuste a la muestra de adultos en Ecuador. Desde una perspectiva teórica, este enfoque permite la correlación de variables como la depresión y la ansiedad, reconociendo sus interrelaciones sin recurrir a la simplificación que implicaría su integración en un único componente. Asimismo, la magnitud de las λ, que varía entre λítem1 = .83 y λítem4 = .91, resulta apropiada en relación con el factor, lo que indica que estos ítems son pertinentes dentro del modelo propuesto y contribuyen significativamente a la explicación de la varianza de la medida.
Figura 1: Estructura factorial del PHQ-4

Equivalencia de medición basado en el género
La Tabla 3 presenta los resultados de la EM basado en el género para el PHQ-4. Los índices de ajuste para el modelo configural fueron adecuados, lo que indica que la estructura factorial del instrumento es consistente entre los grupos. Al añadir restricciones métricas, el ajuste se mantuvo elevado con un cambio mínimo en los índices comparativos, lo que sugiere que las cargas factoriales son equivalentes. Al imponer la invarianza escalar, los resultados continúan mostrando un excelente ajuste y los cambios en los índices fueron irrelevantes, lo que indica que los interceptos de los ítems también son equivalentes. Sin embargo, al evaluar la invarianza estricta, aunque los índices globales de ajuste siguen siendo aceptables, se observó un deterioro notable en el ajuste en comparación con el modelo escalar, lo que sugiere que las varianzas de los errores de medición no son equivalentes entre los grupos. De este modo, se estima que el PHQ-4 es invariante únicamente a nivel escalar.
Tabla 3: Equivalencia de medida (EM) basado en el género del PHQ-4

Nota. χ2: chi-cuadrado; gl: grados de libertad; χ2/gl: chi-cuadrado normado; CFI: Índice de Ajuste Comparativo; TLI: Índice de Tucker-Lewis; SRMR: Residuo Cuadrático Medio Estandarizado; RMSEA: Error Cuadrático Medio de Aproximación; Δ: cambio.
Análisis de consistencia interna
La Tabla 4 muestra los valores α para evaluar la consistencia interna del PHQ-4 en la muestra total y por género. Previamente se comprobó que las correlaciones entre los ítems de cada dimensión son superiores a .60, por lo que este tipo de análisis es viable. La escala total presentó una fiabilidad considerada adecuada tanto para el facto de depresión como el de ansiedad. Por otra parte, en la consistencia interna clasificada por grupos, se observa que el de hombres presenta mayores niveles de consistencia interna con respecto al de las mujeres. En todo caso, en ambos grupos los niveles reportados se consideran aceptables. Sin embargo, cabe señalar que las diferencias entre los coeficientes de fiabilidad imprimen diferencias significativas en el factor de depresión, dado que en los IC no se incluye al 0, lo que apunta a que el grupo de hombres muestra una mayor consistencia interna que el de las mujeres. En el factor de ansiedad se estima que ambos grupos son similares.
Tabla 4: Consistencia interna del PHQ-4

Nota. α: coeficiente de Cronbach; Δ: cambio/diferencia.
Análisis de validez basado en la relación con otras variables
La Figura 2 proporciona una representación del análisis de validez de relación fundamentado en la interacción de diversas variables, cuyo propósito es esclarecer la covarianza que se manifiesta entre la salud mental, específicamente la ansiedad y la depresión, y el bienestar general, considerando estos elementos como constructos interrelacionados con una proximidad teórica relevante. El WHO-5 presenta una relación negativa muy baja con el PHQ-2 y una relación negativa moderada con el GAD-2, lo que sugiere que un incremento en el bienestar general se correlaciona con una reducción leve en los niveles de depresión y una disminución significativa en los niveles de ansiedad. Estos hallazgos no solo aportan evidencia empírica sobre la conexión entre estos constructos, sino que subrayan, por medio de los índices de ajuste, la existencia de una relación sólida y estable que resulta fundamental para la evaluación de estos fenómenos en la población adulta ecuatoriana.
Figura 2: Modelo de ajuste general de la relación latente entre el PHQ-4 y el WHO-5

Nota. χ2: chi-cuadrado; gl: grados de libertad; χ2/gl: chi-cuadrado normado; CFI: Índice de Ajuste Comparativo; TLI: Índice de Tucker-Lewis; SRMR: Residuo Cuadrático Medio Estandarizado; RMSEA: Error Cuadrático Medio de Aproximación. Los círculos representan las variables latentes y los rectángulos las observables. Los valores de las flechas que apuntan a las variables latentes son las cargas factoriales (λ).
Discusión
Los objetivos del estudio consistieron en verificar la estructura factorial, la EM diferenciada por el género, la validez basada en la relación con otras variables y la fiabilidad del PHQ-4 en una muestra de adultos de Ecuador.
Con respecto a la validez factorial, se concluyó que el modelo de ajuste más adecuado para la muestra ecuatoriana es el que corresponde al modelo oblicuo de dos factores (correlacionado), que diferencia claramente la evaluación tanto de la ansiedad como de la depresión. En este aspecto, se debe considerar que el modelo de ajuste concuerda con los resultados de estudios similares de otros países (Carranza Esteban et al., 2024; Caycho-Rodríguez et al., 2024; Christodoulaki et al., 2022; Kazlauskas et al., 2023; Larionow & Mudło-Głagolska, 2023; Mendoza et al., 2024;Mills et al., 2015) y también de Ecuador (Guerra et al., 2022). En este contexto, el uso de estimadores robustos como el DWLS para los análisis factoriales permiten garantizar una mayor precisión y objetividad en las impresiones sobre la validez interna de la medida y reduce la probabilidad de sesgo de medida (Li, 2016).
Acerca de la EM basada en el género, se concluye que el PHQ-4 es invariante por género únicamente en las cargas y los interceptos de la medida. Es decir que es invariante a nivel escalar (fuerte). Estos resultados, por lo tanto, señalan que, de reportarse diferencias entre los grupos, es debido más a las características propias de los grupos que a diferencias en la configuración de la estructura interna de la medida (cargas e interceptos) (Asparouhov & Muthén, 2014). Estos resultados permiten el desarrollo de estudios comparativos por género de la población adulta de Ecuador. Cabe señalar que estos resultados concuerdan con trabajos previos que reportaron una conclusión similar (Mendoza et al., 2024) como característica propia de esta medida al identificar que el género no es un factor de variabilidad de la medida.
Por otro lado, en lo que respecta a la consistencia interna, el PHQ-4 ha demostrado a nivel general y entre grupos que la consistencia reportada es aceptable y adecuada para su valoración en adultos ecuatorianos. Estos resultados se contrastan con trabajos anteriores a nivel global (Christodoulaki et al., 2022; Kazlauskas et al., 2023; Larionow & Mudło-Głagolska, 2023) y en Ecuador (Guerra et al., 2022). Sin embargo, algo que destaca es que las diferencias en la consistencia interna (Δα) entre géneros observadas en nuestra muestra son particularmente destacables, dado que en el factor de depresión los hombres muestran una mayor consistencia interna que las mujeres con diferencias significativas (los IC no incluyeron el 0). Si bien esto no afecta en esencia la interpretación de los resultados, señala que los hombres son más consistentes en la fiabilidad de la medida que las mujeres. En este contexto, no se presentan estudios referenciales previos que señalen esta característica, por lo que esto se considera un avance relevante.
Finalmente, con respecto a la validez basada en la relación con otras variables, se encontró que el PHQ-4 converge de forma negativa muy baja (PHQ-2) y moderada (GAD-2) con el WHO-5, encargado de evaluar el bienestar general. Además, el modelo de ajuste del que se desprende la relación latente señala un ajuste adecuado para su comprensión en la población adulta de Ecuador. Estos hallazgos concuerdan con trabajos previos, en los que se concluye una validez de divergencia con el constructo de bienestar a través del WHO-5 (Kazlauskas et al., 2023; Mendoza et al., 2024) y apunta a señalar lo cercano que pueden ser estos atributos.
Respecto de las implicaciones del estudio, se anota que el PHQ-4 es una medida válida y precisa para la evaluación de los síntomas de ansiedad y depresión en adultos de Ecuador. Esto permitirá de forma práctica que se recurra a esta para los procesos de evaluación en atención primaria que ayuden en la segmentación de las personas según sus necesidades de atención. A su vez, al corroborarse la EM, abre la puerta a los estudios de carácter comparativo por género, lo que ayudará en la detección de diferencias propias entre los hombres y las mujeres. Además, desde un aspecto teórico, estos resultados aportan al desarrollo de la investigación psicométrica de la medida, dado que con la evidencia reportada se amplía su capacidad generalizadora para procesos de evaluación a nivel global, y en especial en el contexto de América del Sur, donde los estudios de validación son escasos.
Es necesario señalar que este estudio cuenta con una limitación relacionada con las características etarias de los participantes, dado que se trabajó únicamente con adultos ecuatorianos, dejando de lado otros segmentos como adolescentes o adultos mayores. Esto reduce su capacidad de validación a este grupo, por lo que estos resultados no pueden ser generalizados. En este aspecto se recomienda a futuro llevar a cabo estudios de validación de la medida con otros grupos etarios de interés. En los análisis de evidencias de validez basado en la relación con otras variables, se empleó el uso del WHO-5, encargado de evaluar el bienestar general. Si bien su uso es pertinente para este proceso, en futuras instancias podría ser recomendable utilizar estudios confirmatorios que empleen medidas más cercanas al PHQ-4 como pruebas específicas de ansiedad y depresión.
Referencias
American Psychiatric Association. (2014). Manual diagnóstico y estadístico de los trastornos mentales. DSM-5 (5a ed.). Editorial Médica Panamericana.
Anxiety and Depression Association of America (2023). Understand the Fact. https://adaa.org/understanding-anxiety
Asher, M., & Aderka, I. M. (2018). Gender Differences in Social Anxiety Disorder. Journal of Clinical Psychology, 74(10). https://doi.org/10.1002/jclp.22624
Asparouhov, T., & Muthén, B. (2014). Multiple-group Factor Analysis Alignment. Structural Equation Modeling, 21(4), 495-508. https://doi.org/10.1080/10705511.2014.919210
Ato, M., López, J. J., & Benavente, A. (2013). Un sistema de clasificación de los diseños de investigación en psicología. Anales de Psicología, 29(3), 1038-1059. https://doi.org/10.6018/analesps.29.3.178511
Beck, A. T., Epstein, N., Brown, G., & Steer, R. (1988). An Inventory for Measuring Clinical Anxiety: Psychometric Properties. Journal of Consulting and Clinical Psychology, 56(6), 893-897. https://doi.org/10.1037/0022-006X.56.6.893
Beck, A., Steer, R., & Brown, G. (1996). Manual for the Beck Depression Inventory—II. Psychological Corporation.
Berry, K., Sheardown, J., Pabbineedi, U., Haddock, G., Cross, C., & Brown, L. J. E. (2020). Barriers and Facilitators to Accessing Psychological Therapies for Severe Mental Health Difficulties in Later Life. Behavioural and Cognitive Psychotherapy, 48(2). https://doi.org/10.1017/S1352465819000596
Browne, M. W., & Cudeck, R. (1992). Alternative Ways of Assessing Model Fit. Sociological Methods & Research, 21(2). https://doi.org/10.1177/0049124192021002005
Byrne, B. M. (2008). Testing for Multigroup Equivalence of a Measuring Instrument: A Walk Through the Process. Psicothema, 20(4). https://www.psicothema.com/pdf/3569.pdf
Carranza Esteban, R. F., Mamani-Benito, O., Cjuno, J., Tito-Betancur, M., Caycho-Rodríguez, T., Vilca, L. W., Torales, J., & Barrios, I. (2024). Adaptation and Validation of the Patient Health Questionnaire for Depression and Anxiety (PHQ-4) in a Sample of Quechua-speaking Peruvians. Medicina Clínica y Social, 8(1). https://doi.org/10.52379/mcs.v8i1.361
Caycho-Rodríguez, T., Travezaño-Cabrera, A., Torales, J., Barrios, I., Vilca, L. W., Samaniego-Pinho, A., Moreta-Herrera, R., Reyes-Bossio, M., Barria-Asenjo, N. A., Ayala-Colqui, J., & Garcia-Cadena, C. H. (2024). Psychometric Network Analysis of the Patient Health Questionnaire-4 (PHQ-4) in Paraguayan General Population. Psicologia: Reflexão e Crítica, 37(1), 1-13. https://doi.org/10.1186/S41155-024-00299-X/METRICS
Chen, Q. (2023). Causes and Treatment of Anxiety Disorder. Lecture Notes in Education Psychology and Public Media, 9(1). https://doi.org/10.54254/2753-7048/9/20230230
Christodoulaki, A., Baralou, V., Konstantakopoulos, G., & Touloumi, G. (2022). Validation of the Patient Health Questionnaire-4 (PHQ-4) to Screen for Depression and Anxiety in the Greek General Population. Journal of Psychosomatic Research, 160. https://doi.org/10.1016/j.jpsychores.2022.110970
Cova, F. (2022). ¿Problemas de salud mental o trastornos mentales? Una distinción ilusoria. Praxis Psy, 22(36). https://doi.org/10.32995/praxispsy.v22i36.173
Derogatis, L. R., Lipman, R. S., & Covi, L. (1973). SCL-90: An Outpatient Psychiatric Rating Scale--Preliminary Report. Psychopharmacology Bulletin, 9(1).
Dominguez-Lara, S. (2018). Propuesta de puntos de corte para cargas factoriales: una perspectiva de fiabilidad de constructo. Enfermería Clínica, 28(6). https://doi.org/10.1016/j.enfcli.2018.06.002
Fajkowska, M., Domaradzka, E., & Wytykowska, A. (2018). Types of Anxiety and Depression: Theoretical Assumptions and Development of the Anxiety and Depression Questionnaire. Frontiers in Psychology, 8. https://doi.org/10.3389/fpsyg.2017.02376
Ferrando, P. J., & Anguiano-Carrasco, C. (2010). El análisis factorial como técnica de investigación en psicología. Papeles del Psicólogo, 31(1). https://www.papelesdelpsicologo.es/resumen?pii=1793
Gao, W., Ping, S., & Liu, X. (2020). Gender Differences in Depression, Anxiety, and Stress Among College Students: A Longitudinal Study from China. Journal of Affective Disorders, 263. https://doi.org/10.1016/j.jad.2019.11.121
Goldberg, D. P. (1972). The Detection of Psychiatric Illness by Questionnaire. Oxford University Press.
Guerra, V. L., Mejia, Á. J. A., & Alcedo, J. M. G. (2022). Psychometric Properties and Factorial Structure of the Patient Health Questionnaire (PHQ-4) in Ecuadorian University Students. Revista Cubana de Enfermeria, 38(3).
Hermosa-Bosano, C., Paz, C., Hidalgo-Andrade, P., García-Manglano, J., Sádaba-Chalezquer, C., López-Madrigal, C., & Serrano, C. (2021). Síntomas de depresión, ansiedad y estrés en la población general ecuatoriana durante la pandemia por covid-19. Revista Ecuatoriana de Neurología, 30(2). https://doi.org/10.46997/revecuatneurol30200040
Huang, Y., Li, Y., Pan, H., & Han, L. (2023). Global, Regional, and National Burden of Neurological Disorders in 204 Countries and Territories Worldwide. Journal of Global Health, 13. https://doi.org/10.7189/JOGH.13.04160
Hyde, J. S., & Mezulis, A. H. (2020). Gender Differences in Depression: Biological, Affective, Cognitive, and Sociocultural Factors. Harvard Review of Psychiatry, 28(1), 4-13. https://doi.org/10.1097/hrp.0000000000000230
Kazlauskas, E., Gelezelyte, O., Kvedaraite, M., Ajdukovic, D., Johannesson, K. B., Böttche, M., Bondjers, K., Dragan, M., Figueiredo-Braga, M., Grajewski, P., Anastassiou-Hadjicharalambous, X., Javakhishvili, J. D., Lioupi, C., Lueger-Schuster, B., Mouthaan, J., Bagaric, I. R., Sales, L., Schäfer, I., Soydas, S., … Lotzin, A. (2023). Psychometric Properties of the Patient Health Questionnaire-4 (PHQ-4) in 9.230 Adults across Seven European Countries: Findings from the ESTSS ADJUST Study. Journal of Affective Disorders, 335, 18-23. https://doi.org/10.1016/j.jad.2023.05.007
Kroenke, K., Spitzer, R. L., & Williams, J. B. W. (2001). The PHQ-9: Validity of a Brief Depression Severity Measure. Journal of General Internal Medicine, 16(9). https://doi.org/10.1046/j.1525-1497.2001.016009606.x
Kroenke, K., Spitzer, R. L., Williams, J. B. W., & Löwe, B. (2009). An Ultra-brief Screening Scale for Anxiety and Depression: The PHQ–4. Psychosomatics, 50(6). https://doi.org/10.1016/s0033-3182(09)70864-3
Lapo-Talledo, G. J., Montes-Escobar, K., Rodrigues, A. L. S., & Siteneski, A. (2025). Hospitalizations for Depressive Disorders in Ecuador: An Eight-year Nationwide Analysis of Trends and Demographic Insights. Journal of Affective Disorders, 374, 433-442. https://doi.org/10.1016/J.JAD.2025.01.074
Larionow, P., & Mudło-Głagolska, K. (2023). The Patient Health Questionnaire-4: Factor Structure, Measurement Invariance, Latent Profile Analysis of Anxiety and Depressive Symptoms and Screening Results in Polish Adults. Advances in Cognitive Psychology, 19(2). https://doi.org/10.5709/acp-0391-2
Li, C. H. (2016). Confirmatory Factor Analysis with Ordinal Data: Comparing Robust Maximum Likelihood and Diagonally Weighted Least Squares. Behavior Research Methods, 48(3). https://doi.org/10.3758/s13428-015-0619-7
Li, L., Niu, Z., Mei, S., & Griffiths, M. D. (2022). A Network Analysis Approach to the Relationship Between Fear of Missing Out (Fomo), Smartphone Addiction, and Social Networking Site Use among a Sample of Chinese University Students. Computers in Human Behavior, 128. https://doi.org/10.1016/j.chb.2021.107086
Lovibond, S. H., & Lovibond, P. F. (1995). Manual for the Depression, Anxiety and Stress Scale-21 Items (DASS-21). Psychology Foundation of Australia.
Luong, R., & Flake, J. K. (2023). Measurement Invariance Testing using Confirmatory Factor Analysis and Alignment Optimization: A Tutorial for Transparent Analysis Planning and Reporting. Psychological Methods, 28(4), 905-924. https://doi.org/10.1037/met0000441
Mardia, K. V. (1970). Measures of Multivariate Skewness and Kurtosis with Applications. Biometrika, 57(3), 519. https://doi.org/10.1093/biomet/57.3.519
McGuinness, T. M., Dyer, J. G., & Wade, E. H. (2012). Gender Differences in Adolescent Depression. Journal of Psychosocial Nursing and Mental Health Services, 50(12). https://doi.org/10.3928/02793695-20121107-04
Mendoza, N. B., Frondozo, C. E., Dizon, J. I. W. T., & Buenconsejo, J. U. (2024). The Factor Structure and Measurement Invariance of the PHQ-4 and the Prevalence of Depression and Anxiety in a Southeast Asian Context amid the covid-19 Pandemic. Current Psychology, 43(25). https://doi.org/10.1007/s12144-022-02833-5
Mills, S. D., Fox, R. S., Pan, T. M., Malcarne, V. L., Roesch, S. C., & Sadler, G. R. (2015). Psychometric Evaluation of the Patient Health Questionnaire–4 in Hispanic Americans. Hispanic Journal of Behavioral Sciences, 37(4). https://doi.org/10.1177/0739986315608126
Moreno-Montero, E., Moreta-Herrera, R., Rodas, J. A., Oriol-Granado, X., Puerta-Cortés, D. X., Ferrufino-Borja, D., Diaz, R. G., Rivera, M. E. L., Samaniego-Pinho, A., Buenahora-Bernal, M., Rojas-Jara, C., & Vega-Arce, M. (2025). Cross-cultural Measurement Equivalence of the Seven-item General Anxiety Disorder Scale (GAD-7) in College Students of Six Countries of Latin American. Journal of Affective Disorders, 380, 598-606. https://doi.org/10.1016/J.JAD.2025.03.188
Moreta-Herrera, R., Caycho-Rodríguez, T., Salinas, A., Jiménez-Borja, M., Gavilanes-Gómez, D., & Jiménez-Mosquera, C. J. (2025). Factorial Validity, Reliability, Measurement Invariance and the Graded Response Model for the covid-19 Anxiety Scale in a Sample of Ecuadorians. Omega, 90(3), 1078-1093. https://doi.org/10.1177/00302228221116515
Moreta-Herrera, R., Dominguez-Lara, S., Vaca-Quintana, D., Zambrano-Estrella, J., Gavilanes-Gómez, D., Ruperti-Lucero, E., & Bonilla, D. (2021). Psychometric Properties of the General Health Questionnaire (GHQ-28) in Ecuadorian College Students. Psihologijske Teme, 30(3). https://doi.org/10.31820/pt.30.3.9
Moreta-Herrera, R., López-Calle, C., Caycho-Rodríguez, T., Cabezas Guerra, C., Gallegos, M., Cervigni, M., Martino, P., Barés, I., & Calandra, M. (2022). Is it Possible to Find a Bifactor Structure in the Fear of covid-19 Scale (FCV-19S)? Psychometric Evidence in an Ecuadorian Sample. Death Studies, 46(9). https://doi.org/10.1080/07481187.2021.1914240
Moreta-Herrera, R., Rodríguez-Lorenzana, A., Mascialino, G., Castro-Ochoa, F., Narváez-Pillco, V., Caycho-Rodríguez, T., & Mayorga-Lascano, M. (2024). Psychometric Properties of the 28-item General Health Scale (GHQ-28). Analysis from the Classical Test and Item Response Theories in Ecuadorian University Students. Psychology Hub, 41(3), 43-54. https://doi.org/10.13133/2724-2943/18460
R Core Team. (2024). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.r-project.org/
Rutakumwa, R., Tusiime, C., Mpango, R. S., Kyohangirwe, L., Kaleebu, P., Patel, V., & Kinyanda, E. (2023). A Qualitative Exploration of Causes of Depression among Persons Living with HIV Receiving Antiretroviral Therapy in Uganda: Implications for Policy. Psychiatry Journal. https://doi.org/10.1155/2023/1986908
Rutkowski, L., & Svetina, D. (2017). Measurement Invariance in International Surveys: Categorical Indicators and Fit Measure Performance. Applied Measurement in Education, 30(1). https://doi.org/10.1080/08957347.2016.1243540
Sánchez-Vélez, H., & Moreta-Herrera, R. (2022). Fear and Anxiety of covid-19, Stress and Health Perception. A Predictive Model in Ecuadorian Hospital Patients. Anales de Psicología, 38(3), 439-447. https://doi.org/10.6018/analesps.489761
Simancas-Pallares, M., Díaz-Cárdenas, S., Barbosa-Gómez, P., Buendía-Vergara, M., & Arévalo-Tovar, L. (2016). Propiedades psicométricas del Índice de Bienestar General-5 de la Organización Mundial de la Salud en pacientes parcialmente edéntulos. Revista de la Facultad de Medicina, 64(4). https://doi.org/10.15446/revfacmed.v64n4.52235
Şimşek, G. G., & Noyan, F. (2013). McDonald’s ωt, Cronbach’s α, and Generalized θ for Composite Reliability of Common Factors Structures. Communications in Statistics - Simulation and Computation, 42(9). https://doi.org/10.1080/03610918.2012.689062
Spielberger, C. D., Gorsuch, R. L., & Lushene, R. E. (1970). Manual for the State-Trait Anxiety Inventory (Self-Evaluation Questionnaire). Consulting Psychologists Press.
Spitzer, R. L., Kroenke, K., & Williams, J. B. W. (1999). Validation and Utility of a Self-report Version of PRIME-MD: The PHQ Primary Care Study. Journal of the American Medical Association, 282(18). https://doi.org/10.1001/jama.282.18.1737
Wolf, E. J., Harrington, K. M., Clark, S. L., & Miller, M. W. (2013). Sample Size Requirements for Structural Equation Models: An Evaluation of Power, Bias, and Solution Propriety. Educational and Psychological Measurement, 73(6). https://doi.org/10.1177/0013164413495237
World Health Organization. (2022). World Mental Health Report: Transforming Mental Health for all. Executive Summary. https://www.who.int/publications/i/item/9789240049338
World Health Organization (2024). The World Health Organization-Five Well-Being Index (WHO-5). https://www.who.int/publications/m/item/WHO-UCN-MSD-MHE-2024.01
Yang-Wallentin, F., Jöreskog, K. G., & Luo, H. (2010). Confirmatory Factor Analysis of Ordinal Variables with Misspecified Models. Structural Equation Modeling, 17(3). https://doi.org/10.1080/10705511.2010.489003
Yildirim, M., Gaynes, B. N., Keskinocak, P., Pence, B. W., & Swann, J. (2022). DIP: Natural history model for major depression with incidence and prevalence. Journal of Affective Disorders, 296. https://doi.org/10.1016/j.jad.2021.09.079
Zung, W. W. K. (1986). Zung Self-Rating Depression Scale and Depression Status Inventory. Assessment of Depression. https://doi.org/10.1007/978-3-642-70486-4_21
Financiamiento: Este estudio no recibió ninguna financiación externa ni apoyo financiero.
Conflicto de interés: Los autores declaran no tener ningún conflicto de interés.
Disponibilidad de datos: El conjunto de datos que apoya los resultados de este estudio no se encuentra disponible.
Cómo citar: Cuesta-Andaluz, E., Moreta-Herrera, R., Moya-Solís, A., Santillán-García, N., & Moreno-Montero, E. (2025). Propiedades psicométricas del Patient Health Questionnaire-4 en una muestra de adultos del Ecuador. Ciencias Psicológicas, 19(2), e-4481. https://doi.org/10.22235/cp.v19i2.4481
Contribución de los autores (Taxonomía CRediT): 1. Conceptualización; 2. Curación de datos; 3. Análisis formal; 4. Adquisición de fondos; 5. Investigación; 6. Metodología; 7. Administración de proyecto; 8. Recursos; 9. Software; 10. Supervisión; 11. Validación; 12. Visualización; 13. Redacción: borrador original; 14. Redacción: revisión y edición.
E. C. A. ha contribuido en 1, 2, 3, 6, 9, 11, 12, 13, 14; R. M. H. en 1, 2, 3, 5, 6, 9, 10, 12, 13, 14; A. M. S. en 3, 5, 6, 8, 11, 13, 14; N. S. G. en 3, 5, 6, 8, 11, 13, 14; E. M. M. en 1, 2, 3, 6, 9, 11, 12, 13, 14.
Editora científica responsable: Dra. Cecilia Cracco.
Ciencias Psicológicas; v19(2)
July-December 2025
10.22235/cp.v19i2.4481
Original Articles
Psychometric Properties of the Patient Health Questionnaire-4 in a Sample of Adults from Ecuador
Propiedades psicométricas del Patient Health Questionnaire-4 en una muestra de adultos de Ecuador
Propriedades psicométricas do Patient Health Questionnaire-4 em uma amostra de adultos do Equador
Evelyn Cuesta-Andaluz1 ORCID 0000-0002-5173-2514
Rodrigo Moreta-Herrera2 ORCID 0000-0003-0134-5927
Adriana Moya-Solís3 ORCID 0000-0002-3744-927X
Nazury Santillán-García4 ORCID 0000-0003-1117-2177
Esteban Moreno-Montero5 ORCID 0000-0002-3477-9417
1 Universidad Internacional de La Rioja, Spain
2 Pontificia Universidad Católica del Ecuador, Ecuador, [email protected]
3 Pontificia Universidad Católica del Ecuador, Ecuador
4 Universidad Estatal de Milagro, Ecuador
5 Universidad de La Coruña, Spain
Abstract:
Objective: To analyze the psychometric
properties of the Patient Health Questionnaire-4 (PHQ-4) in a sample of
Ecuadorian adults. 
Method: Psychometric study in which factorial validity, measurement
equivalence differentiated by gender and internal consistency of the instrument
are analyzed. 
Participants: 406 Ecuadorian adults, 68.47 % women, aged between 18 and
59 years (M = 27.43; SD = 8.20). 
Results: The oblique two-factor model of the PHQ is confirmed, with the
dimensions of depression and anxiety. Furthermore, the measure is equivalent at
the scalar level based on gender. Internal consistency is adequate and presents
divergent validity with measures of general well-being. 
Conclusion: The PHQ-4 is a valid and reliable instrument for rapid
assessment of anxiety and depression in Ecuadorian adults.
Keywords: anxiety; depression; measurement equivalence; reliability; validity.
Resumen:
Objetivo: Analizar las propiedades
psicométricas del Patient Health Questionnaire-4 (PHQ-4) en una muestra de
adultos de Ecuador. 
Método: Estudio de carácter
psicométrico en el que se analizan la validez factorial, la equivalencia de
medida diferenciada por el género y la consistencia interna del instrumento. 
Participantes: 406 adultos
ecuatorianos, el 68.47 % corresponden a mujeres, con edades entre 18 y 59 años
(M = 27.43; DE = 8.20). 
Resultados: Se confirma el
modelo oblicuo de dos factores del PHQ, con las dimensiones de depresión y
ansiedad. Además, la medida es equivalente a nivel escalar a partir del género.
La consistencia interna es adecuada y presenta una validez divergente con
medidas de bienestar general. 
Conclusión: El PHQ-4 es un
instrumento válido y confiable para la evaluación rápida de la ansiedad y la
depresión en adultos de Ecuador.
Palabras clave: ansiedad; depresión; equivalencia de medida; fiabilidad; validez.
Resumo:
Objetivo: Analisar as propriedades psicométricas do Patient Health Questionnaire-4 (PHQ-4) em uma amostra de adultos equatorianos.
Método: Estudo psicométrico no qual se
analisa a validade fatorial, a equivalência de medida diferenciada por gênero e
a consistência interna do instrumento. 
Participantes: 406 adultos equatorianos, 68,47 % mulheres, com idades
entre 18 e 59 anos (M = 27,43; DP = 8,20). 
Resultados: Confirma-se o modelo bifatorial oblíquo do PHQ, com as
dimensões depressão e ansiedade. Além disso, a medida mostrou-se equivalente ao
nível escalar de acordo com o gênero. A consistência interna é adequada e
apresenta validade divergente em relação às medidas de bem-estar geral. 
Conclusão: O PHQ-4 é um instrumento válido e confiável para a avaliação
rápida de ansiedade e depressão em adultos equatorianos.
Palavras-chave: ansiedade; depressão; equivalência de medida; confiabilidade; validade.
Received: 15/02/2025
Accepted: 22/09/2025
Mental health is defined as a state of psychological and social well-being that enables individuals to manage daily stress, maintain meaningful relationships, and make sound decisions (World Health Organization (WHO), 2022). It is an essential component of overall health and quality of life, the deficit of which can lead to mental disorders (Cova, 2022). Among these, anxiety and depression stand out due to their prevalence and negative impact on individuals' lives (Fajkowska et al., 2018; Moreta-Herrera et al., 2024) making them relevant for study and intervention.
Depression, characterized by symptoms such as persistent sadness, loss of interest or pleasure in activities, constant fatigue, changes in appetite, concentration difficulties, and recurrent thoughts of death or suicide (American Psychiatric Association (APA), 2014; Bahamón et al., 2023; Lascano-Arias et al., 2025), has multifactorial causes including genetic, biological, psychological, and environmental components (Rutakumwa et al., 2023). Globally, more than 280 million people suffer from this condition, making it a leading cause of social disability (Yildirim et al., 2022), with gender differences as women often report more depression than men (Hyde & Mezulis, 2020; McGuinness et al., 2012). In Latin America, this condition affects 22 % of the population (Huang et al., 2023), while in Ecuador, it is estimated that around 10 % exhibit these symptoms (Lapo-Talledo et al., 2025).
Anxiety, conversely, manifests as a state of excessive worry, restlessness, and neurovegetative symptoms, including palpitations, sweating, and muscle tension (APA, 2014). Like depression, its etiology is multifactorial, encompassing genetic predispositions and stressful life experiences (Chen, 2023; Moreta-Herrera, Jadán-Guerrero, et al., 2025). Gender-based differences are also evident, with women experiencing this condition more frequently than men (Asher & Aderka, 2018; Gao et al., 2020). Globally, anxiety disorders affect approximately 4 % of the population as specific disorders (Anxiety and Depression Association of America, 2023), while in Ecuador, symptomatic presence is noted in 25 % of the population, with an increase observed following the COVID-19 pandemic (Hermosa-Bosano et al., 2021; Sánchez-Vélez & Moreta-Herrera, 2022).
Given the high incidence of these symptoms in the general population, which necessitates professional assistance, and the limitations and difficulties encountered in accessing timely public healthcare (Berry et al., 2020), the evaluation and diagnostic process is crucial. Consequently, the role of psychometric research is significant, not only in generating and adapting measures to diverse contexts and situations but also in enabling precise assessments of mental attributes of sanitary priority, as well as being rapid and efficient in terms of resource availability (personal, time, costs, among others). In the case of Ecuador, there is a marked limitation of available measures for psychological assessment, including conditions of anxiety and depression.
Depression and anxiety assessment measures
Various assessment tools have been developed globally to evaluate anxiety and depression, each employing distinct evaluative approaches. Among the most frequently utilized specialized measures are the Beck Anxiety Inventory (BAI; Beck et al., 1988), the State-Trait Anxiety Inventory (STAI; Spielberger et al., 1970), the Beck Depression Inventory (BDI; Beck et al., 1996), and the Zung Self-Rating Depression Scale (Zung, 1986). Furthermore, multi-faceted assessment measures for mental health conditions, such as the General Health Questionnaire (GHQ-28; Goldberg, 1972) which includes a 28-item adapted version in Ecuador (GHQ-28; Moreta-Herrera et al., 2021), the Symptom Checklist-90-Revised (SCL-90 R; Derogatis et al., 1973) and the Depression Anxiety Stress Scales-21 (DAS-21; Lovibond & Lovibond, 1995), are also prominent. These instruments are designed for rapid screening processes and brief segmentation of individuals in primary care, facilitating improved classification of patients requiring specialized care.
Within the group of measures that jointly assess anxiety and depression, the Patient Health Questionnaire (PHQ; Spitzer et al., 1999) initially developed in English as a 15-item self-report, is notable. This tool aims to identify depression and anxiety criteria in primary care, not for specific diagnoses, but rather for subsequent referral. Its versatility has led to widespread use globally, with shorter versions such as the PHQ-9 (Kroenke et al., 2001) and the PHQ-4 (Kroenke et al., 2009) developed to expedite the identification of indicators of disturbance.
The Patient Health Questionnaire-4 (PHQ-4) is an ultra-brief version of the PHQ, comprising four items: two related to anxiety (GAD-2) and two to depression (PHQ-2), facilitating its application across diverse clinical and population settings. Its psychometric properties have been extensively tested and validated in numerous international studies with adults, including research in Austria, Croatia, Georgia, Germany, Lithuania, Portugal, and Sweden (Kazlauskas et al., 2023), Greece (Christodoulaki et al., 2022), Poland (Larionow & Mudło-Głagolska, 2023), and Philippines (Mendoza et al., 2024) which also verifies measurement equivalence (ME) based on gender, among other factors. Within Spanish-speaking contexts, validation and adaptation studies have been conducted in Latin American populations in the United States (Mills et al., 2015), Paraguay (Caycho-Rodríguez et al., 2024) and Perú (Carranza Esteban et al., 2024). In Ecuador, the analysis of its psychometric properties and validation has been reported, albeit with samples of university students (Guerra et al., 2022).
Reviewed studies confirm the two-factor correlated (oblique) structure of the measure, in addition to ratifying adequate internal consistency within its items according to each factor. Convergent validity with measures of well-being, acceptance, and commitment is maintained, as is divergent validity with measures of stress, anxiety, and depression, and finally, measurement equivalence (ME) based on gender.
The present study
The COVID-19 post-pandemic era has witnessed increased levels of anxiety and depression in both the region (Moreno-Montero et al., 2025) and Ecuador (Moreta-Herrera, Caycho-Rodríguez, et al., 2025; Sánchez-Vélez & Moreta-Herrera, 2022), placing strain on the public health system. This necessitates the availability of rapid screening instruments such as the Patient Health Questionnaire-4 (PHQ-4), duly validated and calibrated for the general population and adapted to the evolving post-pandemic circumstances, to facilitate their application in efficient screening processes. Furthermore, from a psychometric perspective, while a study of the PHQ-4 exists within an Ecuadorian sample that may serve as a reference (Guerra et al., 2022), it is imperative to note that confirmatory factor analyses (CFA) were not conducted utilizing robust estimation methods, despite the ordinal nature of the items, a factor that may distort the ultimate criteria regarding the adjustments and suitability of the measure, potentially compromising the internal validity of the study and leading to measurement bias (Li, 2016) and an elevated risk of Type I error. Therefore, it is essential to verify the psychometric properties, including factorial validity, measurement invariance (MI) based on gender, given the accumulating evidence suggesting gender-based differences in anxiety and depression (Asher & Aderka, 2018; Gao et al., 2020; Hyde & Mezulis, 2020; McGuinness et al., 2012) and validity based on relationships with other associated variables through the application of robust estimators, particularly with measures such as well-being, considering its typically close association with mental health conditions (Kazlauskas et al., 2023; Mendoza et al., 2024) as well as internal consistency to minimize any factors that might compromise the measure's precision.
This study aims to (1) evaluate the dimensionality of the PHQ-4 in an Ecuadorian adult sample, (2) determine its internal consistency, (3) analyze measurement invariance based on gender, and (4) explore validity based on its relationship with psychological well-being, hypothesizing adequate internal validity (H1), satisfactory internal consistency (H2), adequate measurement invariance based on gender (H3), and a significant relationship with psychological well-being (H4).
Method
Design
The present study employed a quantitative, instrumental approach (Ato et al., 2013) to confirm the internal structure and internal consistency reliability of the PHQ-4 in a sample of Ecuadorian adults. Furthermore, the study examined differential item functioning (DIF) by gender and assessed validity based on relationships with other variables.
Participants
Participants included 406 Ecuadorian individuals (68.47 % female), aged 18 to 59 years (M = 27.43; SD = 8.20), with 81.42 % residing in urban areas and 18.58 % in rural areas. The sample consisted of 51.97 % university students and 48.03 % general population, with 73.89 % of the total sample having attained a university education. The majority of participants were single (74.87 %). A non-probabilistic snowball sampling method was used, along with convenience sampling, and inclusion criteria comprised voluntary participation, being over 18 years of age, and an educational level appropriate for their age to ensure comprehension of the instruments. Exclusion criteria included intellectual disability, effects of substances or drugs affecting consciousness, and lack of Spanish language proficiency.
Instruments
Patient Health Questionnaire-4 (PHQ-4; Kroenke et al., 2009) a concise tool designed for assessing symptoms of anxiety and depression in pre-clinical and research settings, comprises four items divided into two subscales: the PHQ-2 and the GAD-2. Responses are recorded on a 4-point Likert scale ranging from never (0) to every day (3). The total score reflects the intensity of general symptoms, while the subscales allow for the identification of anxiety and depression levels separately, with higher scores indicating greater symptom severity. Psychometric properties reported for the original version show reliability values of α = .86 and .89 for the PHQ2 and the GAD-2, respectively, while the Ecuadorian sample yielded ω = .780 for the PHQ-2 and ω = .838 for the GAD-2 (Guerra et al., 2022).
World Health Organization Five Well-Being Index (WHO-5; WHO, 2024) in its Spanish-translated version (Simancas-Pallares et al., 2016), includes five items, with higher scores representing higher levels of perceived well-being over the preceding 2 weeks. Items are rated on a Likert scale ranging from none of the time (0) to all the time (5), resulting in a total score ranging from 0 to 25 points. The instrument exhibits a Cronbach's alpha of α = .852, indicating adequate reliability (Simancas-Pallares et al., 2016).
Procedure
For the procedures, a survey was designed on Google Forms and disseminated across various higher education institutions in Ecuador to recruit a significant number of participants. Potential participants received detailed information regarding the study's objectives, security measures, anonymity of responses, voluntary participation, and the option to withdraw without repercussions. Those who agreed to participate completed the assessment in approximately 15 minutes. Upon completion, participants were asked to share the evaluation link among their personal contacts to expand the accessibility to the general population. Subsequently, the information was digitally cleaned and systematized for statistical management, results formulation, hypothesis testing, and the preparation of research reports. Ethical considerations adhered to the ethical criteria and standards for research involving human subjects as outlined in the Declaration of Helsinki. The project from which this study is derived was approved by the institutional review board of the Pontificia Universidad Católica del Ecuador Sede Ambato (Pucesa).
Data análisis
The statistical management of the results was divided into five blocks. Initially, a preliminary analysis of the PHQ-4 items was conducted, employing measures such as the arithmetic mean (M), standard deviation (SD), skewness (g1), and kurtosis (g2). Univariate normality was assessed, adhering to the criterion that g1 and g2 values should fall within ~1.5 (Ferrando & Anguiano-Carrasco, 2010). Subsequently, multivariate normality was analyzed using Mardia's test (Mardia, 1970), where non-significance (p > .05) in g1 and g2 was considered evidence of multivariate normality. The second block involved Confirmatory Factor Analysis (CFA) based on a matrix of polychoric correlations, employing Diagonally Weighted Least Squares (DWLS) estimation due to the absence of multivariate normality and the categorical nature of the items (Li et al., 2022; Moreta-Herrera et al., 2025). This phase analyzed three models: (1) unidimensional, (2) oblique two-factor, and (3) hierarchical with two first-order factors and one second-order factor. Assessment of the oblique model, as proposed by Kroenke et al. (2009) considered seven indices: Chi-square (χ²), normed Chi-square (χ²/df), Comparative Fit Index (CFI), Tucker-Lewis Index (TLI), Standardized Root Mean Square Residual (SRMR), Root Mean Square Error of Approximation (RMSEA), and item factor loadings (λ). Adequate fit was defined as χ² p > .05 or χ²/df < 4; CFI and TLI > .95; SRMR and RMSEA < .06 (with .08 as an acceptable tolerance) (Browne & Cudeck, 1992; Byrne, 2008; Wolf et al., 2013; Yang-Wallentin et al., 2010). Item factor loadings (λ) were deemed adequate if exceeding λ > .40 (Dominguez-Lara, 2018).
In the third section, measurement equivalence (ME) of the PHQ-4 was analyzed based on gender using a multigroup confirmatory factor analysis (MG-CFA) with DWLS estimation to rule out differences between groups in the internal structure (Asparouhov & Muthén, 2014; Moreta-Herrera et al., 2022). During this process, restrictions were imposed on the factor loadings (metric), intercepts (scalar or strong), and residuals (strict) to determine whether changes in fit indices (χ², CFI, and RMSEA) were significant. ME was assumed if the change (Δ) in χ² was not significant (p > .05), although this may not be met due to the sample size (Luong & Flake, 2023); furthermore, it was required that ΔCFI ≤ .015 and ΔRMSEA ≤ .01 for each stage of restriction (Rutkowski & Svetina, 2017).
The third section also evaluated internal consistency using Cronbach's alpha (α). Although McDonald's omega coefficient (ω) has been recognized as a more robust metric for assessing scale reliability, especially in models with heterogeneous factor loadings, its calculation requires well-identified models (Şimşek & Noyan, 2013). In this case, due to the oblique structure of the PHQ-4 and the problems associated with estimating ω in individual dimensions, α was chosen as the primary measure of reliability.
Accepted reference values for interpreting internal consistency indicate that an α ≥ .70 is considered acceptable. It should be noted that, although with caution, reliability analysis with two items per factor is fully viable when the correlations between items are high or extremely high, being recommended from .60 (Lapo-Talledo et al., 2025). As the internal consistency is broken down by groups, the differences in reliability between groups are also presented, for which both the values of the coefficient (Δα) and the confidence intervals (CI) are subtracted. Differences in internal consistency between groups are estimated to exist when the values of the CIs do not include 0.
Finally, the fifth section addressed validity based on the relationship with other variables through Structural Equation Modeling (SEM), identifying latent covariances between the PHQ-4 and a measure of well-being (WHO-5). Relationships greater than ρ > .20 are expected, with fit indices like those of the CFA in the general fit model.
It should be noted that the statistical analyses were performed using the R programming language, version 4.3.1 (R Core Team, 2024) and the packages used were lavaan for the CFA, semTools for the EM, MNV for multivariate normality and MBESS for the reliability indices.
Results
Preliminary analysis of ítems
Table 1 presents the preliminary analysis of the items comprising the PHQ-4. The means for the items ranged from M(Item3) = 0.66, SD = 0.80 to M(Item1) = 0.77, SD = 0.79. Regarding distribution indices, skewness values ranged from 0.93 to 1.06 and kurtosis values ranged from 0.47 to 0.68, suggesting a slight deviation from normality in the item distributions. Furthermore, results from the multivariate normality analysis indicated significant value for both skewness and kurtosis, confirming the violation of multivariate normality assumptions. Finally, the correlation matrix demonstrated positive associations between the items, with coefficients ranging from .528 to .632, supporting the internal consistency of the instrument. Given these findings, the application of robust estimators for subsequent factor analyses is deemed essential to ensure valid and reliable results.
Table 1: Preliminary analysis of PHQ-4 items

Note. M: mean; SD: standard deviation; g1: asymmetry; g2: kurtosis.
*** p < .001
Confirmatory factor análisis
Table 2 presents the results of the confirmatory factor analyses (CFA) of the PHQ-4, evaluating various models of fitness. Both the oblique and hierarchical models demonstrated the best fit, with near-maximum values. In accordance with previous literature, the oblique model is frequently utilized in psychometric studies of the PHQ-4, as it assumes a structure of two correlated factors reflecting the dimensions of depression and anxiety. This model is congruent with the results obtained, highlighting its superiority in terms of parsimony and theoretical fit. Therefore, it is concluded that the oblique model is the most appropriate for describing the factorial structure of the PHQ-4 in the sample studied.
Table 2: Confirmatory factor analysis of PHQ-4

Note. χ2: chi-square; df: degrees of freedom; χ2/df: normative chi-square; CFI: Comparative Adjustment Index; TLI: Tucker-Lewis Index; SRMR: Standardized Mean Square Residual; RMSEA: Mean Square Error of Approximation.
++ Two first-order factors and one second-order factor
As depicted in Figure 1, the oblique model emerges as the most suitable configuration for the PHQ-4, demonstrating results that validate its appropriate fit within the adult sample in Ecuador. From a theoretical standpoint, this approach facilitates the correlation of variables such as depression and anxiety, acknowledging their interrelationships without resorting to the simplification inherent in integrating them into a single component. Furthermore, the magnitude of the λ coefficients, ranging from λitem1 = .83 to λitem4 = .91, is deemed appropriate in relation to the factor, indicating that these items are pertinent within the proposed model and contribute significantly to explaining the variance of the measure.
Figure 1: Factor structure of PHQ-4

Gender-based measurement equivalence
Table 3 presents the results of the Measurement Equivalence (ME) based on gender for the PHQ-4. The fit indices for the configural model were adequate, indicating that the factorial structure of the instrument is consistent across groups. With the addition of metric constraints, the fit remained high with minimal change in the comparative indices, suggesting that the factor loadings are equivalent. Upon imposing scalar invariance, the results continued to demonstrate excellent fit, and changes in the indices were irrelevant, indicating that the item intercepts are also equivalent. However, when evaluating strict invariance, although the global fit indices remained acceptable, a notable deterioration in fit was observed compared to the scalar model, suggesting that the variances of the measurement errors are not equivalent between groups. Thus, it is estimated that the PHQ-4 is invariant only at the scalar level.
Table 3: Gender-based measurement equivalence of PHQ-4

Note. ꭓ2: chi-squared; (DF): degrees of freedom; CFI: Comparative Fit Index; RMSEA: Root Mean Square Error of Approximation; Δ: change.
Internal consistency análisis
Table 4 presents the α values for evaluating the internal consistency of the PHQ-4 in the total sample and by gender. Prior verification confirmed that correlations between items within each dimension exceed 0.60, rendering this type of analysis viable. The total scale exhibited adequate reliability for both the depression and anxiety factors. When classified by gender, the male group demonstrated higher levels of internal consistency compared to the female group; however, reported levels were acceptable for both groups. Significant differences were observed in the depression factor reliability coefficients, as the confidence intervals (CI) did not include 0, suggesting greater internal consistency among males than females. Conversely, the anxiety factor showed similar internal consistency between both groups.
Table 4: Internal consistency of PHQ-4

Note. α: Cronbach's coefficient; Δ: change/difference.
Validity analysis based on the relationship with other variables
Figure 2 provides a representation of the validity analysis based on the interaction of diverse variables, the purpose of which is to clarify the covariance that manifests between mental health, specifically anxiety and depression, and general well-being, considering these elements as interrelated constructs with relevant theoretical proximity. The WHO-5 presents an exceptionally low negative relationship with the PHQ-2 and a moderate negative relationship with the GAD-2, suggesting that an increase in general well-being correlates with a slight reduction in depression levels and a significant decrease in anxiety levels. These findings not only provide empirical evidence on the connection between these constructs but also underscore, through the adjustment indices, the existence of a robust and stable relationship that is fundamental for the evaluation of these phenomena in the Ecuadorian adult population.
Figure 2: Model of general fit of the latent relationship between PHQ-4 and WHO-5

Note. χ2: Chi-square; df: Degrees of freedom; χ2/df: Normative chi-square; CFI: Comparative Adjustment Index; TLI: Tucker-Lewis Index; SRMR: Standardized mean square residual; RMSEA: Mean square error of approximation. The circles represent the latent variables, and the rectangles represent the observable ones. The values of the arrows pointing to the latent variables are the factor loads (λ).
Discussion
The objectives of the present study were to examine the factorial structure, measurement equivalence (ME) across gender, validity based on relationships with other variables, and reliability of the PHQ-4 in a sample of Ecuadorian adults.
Regarding factorial validity, findings indicated that the most suitable model for the Ecuadorian sample was the oblique two-factor (correlated) model, which distinctly differentiates the assessment of both anxiety and depression. This model alignment is consistent with results from similar studies conducted in other countries (Carranza Esteban et al., 2024; Caycho-Rodríguez et al., 2024; Christodoulaki et al., 2022; Kazlauskas et al., 2023; Larionow & Mudło-Głagolska, 2023; Mendoza et al., 2024;Mills et al., 2015) and within Ecuador (Guerra et al., 2022). In this context, the utilization of robust estimators such as DWLS for factor analyses enhances the precision and objectivity of inferences regarding the internal validity of the measure and reduces the likelihood of measurement bias (Li, 2016).
Concerning ME based on gender, the study concluded that the PHQ-4 exhibits invariance across gender only in the factor loadings and intercepts, signifying scalar (strong) invariance. Consequently, observed differences between groups are attributable to the inherent characteristics of those groups rather than variations in the configuration of the measure's internal structure (loadings and intercepts) (Asparouhov & Muthén, 2014). These results facilitate comparative studies by gender within the adult population of Ecuador. Notably, these findings agree with previous research that reported similar conclusions (Mendoza et al., 2024) identifying that gender is not a source of variability in the measure.
Regarding internal consistency, the PHQ-4 has demonstrated acceptable and adequate reported consistency for assessment in Ecuadorian adults, both overall and within subgroups. These findings align with previous studies conducted globally (Christodoulaki et al., 2022; Kazlauskas et al., 2023; Larionow & Mudło-Głagolska, 2023) and within Ecuador (Guerra et al., 2022). However, a notable observation is the difference in internal consistency (Δα) between genders within our sample, particularly in the depression factor, where men exhibit greater internal consistency than women, with significant differences (the CIs did not include 0). While this does not fundamentally alter the interpretation of the results, it indicates that men are more consistent in the reliability of the measure compared to women. Notably, no prior reference studies highlight this characteristic, making it a potentially relevant advancement.
Finally, concerning validity based on the relationship with other variables, the PHQ-4 demonstrates an extremely low negative convergence (PHQ-2) and a moderate negative convergence (GAD-2) with the WHO-5, which assesses general well-being. Furthermore, the model fit from which the latent relationship is derived indicates adequate fit for comprehension within the adult population of Ecuador. These findings are consistent with prior work concluding divergent validity with the construct of well-being through the WHO-5 (Kazlauskas et al., 2023; Mendoza et al., 2024) suggesting the proximity of these attributes.
Regarding the implications of the study, it is noted that the PHQ-4 is a valid and precise measure for evaluating symptoms of anxiety and depression in Ecuadorian adults. This will allow its practical application in primary care assessment processes, aiding in the segmentation of individuals according to their care needs. Furthermore, the confirmed measurement equivalence (ME) facilitates comparative studies by gender, assisting in the detection of inherent differences between men and women. From a theoretical perspective, these results contribute to the development of psychometric research on the measure, expanding its generalizability for evaluation processes globally, particularly in the South American context where validation studies are scarce.
It is necessary to acknowledge a limitation related to the age characteristics of the participants, as the study focused solely on Ecuadorian adults, excluding other segments such as adolescents or older adults, thereby reducing its validation capacity for these groups, and thus these results cannot be generalized. Future studies validating the measure in other age groups of interest are recommended. In the analyses of validity evidence based on the relationship with other variables, the WHO-5, which evaluates general well-being, was used. While its use is pertinent for this process, future confirmatory studies employing measures more closely aligned with the PHQ-4, such as specific anxiety and depression tests, may be advisable.
References:
American Psychiatric Association. (2014). Manual diagnóstico y estadístico de los trastornos mentales. DSM-5 (5a ed.). Editorial Médica Panamericana.
Anxiety and Depression Association of America (2023). Understand the Fact. https://adaa.org/understanding-anxiety
Asher, M., & Aderka, I. M. (2018). Gender Differences in Social Anxiety Disorder. Journal of Clinical Psychology, 74(10). https://doi.org/10.1002/jclp.22624
Asparouhov, T., & Muthén, B. (2014). Multiple-group Factor Analysis Alignment. Structural Equation Modeling, 21(4), 495-508. https://doi.org/10.1080/10705511.2014.919210
Ato, M., López, J. J., & Benavente, A. (2013). Un sistema de clasificación de los diseños de investigación en psicología. Anales de Psicología, 29(3), 1038-1059. https://doi.org/10.6018/analesps.29.3.178511
Beck, A. T., Epstein, N., Brown, G., & Steer, R. (1988). An Inventory for Measuring Clinical Anxiety: Psychometric Properties. Journal of Consulting and Clinical Psychology, 56(6), 893-897. https://doi.org/10.1037/0022-006X.56.6.893
Beck, A., Steer, R., & Brown, G. (1996). Manual for the Beck Depression Inventory—II. Psychological Corporation.
Berry, K., Sheardown, J., Pabbineedi, U., Haddock, G., Cross, C., & Brown, L. J. E. (2020). Barriers and Facilitators to Accessing Psychological Therapies for Severe Mental Health Difficulties in Later Life. Behavioural and Cognitive Psychotherapy, 48(2). https://doi.org/10.1017/S1352465819000596
Browne, M. W., & Cudeck, R. (1992). Alternative Ways of Assessing Model Fit. Sociological Methods & Research, 21(2). https://doi.org/10.1177/0049124192021002005
Byrne, B. M. (2008). Testing for Multigroup Equivalence of a Measuring Instrument: A Walk Through the Process. Psicothema, 20(4). https://www.psicothema.com/pdf/3569.pdf
Carranza Esteban, R. F., Mamani-Benito, O., Cjuno, J., Tito-Betancur, M., Caycho-Rodríguez, T., Vilca, L. W., Torales, J., & Barrios, I. (2024). Adaptation and Validation of the Patient Health Questionnaire for Depression and Anxiety (PHQ-4) in a Sample of Quechua-speaking Peruvians. Medicina Clínica y Social, 8(1). https://doi.org/10.52379/mcs.v8i1.361
Caycho-Rodríguez, T., Travezaño-Cabrera, A., Torales, J., Barrios, I., Vilca, L. W., Samaniego-Pinho, A., Moreta-Herrera, R., Reyes-Bossio, M., Barria-Asenjo, N. A., Ayala-Colqui, J., & Garcia-Cadena, C. H. (2024). Psychometric Network Analysis of the Patient Health Questionnaire-4 (PHQ-4) in Paraguayan General Population. Psicologia: Reflexão e Crítica, 37(1), 1-13. https://doi.org/10.1186/S41155-024-00299-X/METRICS
Chen, Q. (2023). Causes and Treatment of Anxiety Disorder. Lecture Notes in Education Psychology and Public Media, 9(1). https://doi.org/10.54254/2753-7048/9/20230230
Christodoulaki, A., Baralou, V., Konstantakopoulos, G., & Touloumi, G. (2022). Validation of the Patient Health Questionnaire-4 (PHQ-4) to Screen for Depression and Anxiety in the Greek General Population. Journal of Psychosomatic Research, 160. https://doi.org/10.1016/j.jpsychores.2022.110970
Cova, F. (2022). ¿Problemas de salud mental o trastornos mentales? Una distinción ilusoria. Praxis Psy, 22(36). https://doi.org/10.32995/praxispsy.v22i36.173
Derogatis, L. R., Lipman, R. S., & Covi, L. (1973). SCL-90: An Outpatient Psychiatric Rating Scale--Preliminary Report. Psychopharmacology Bulletin, 9(1).
Dominguez-Lara, S. (2018). Propuesta de puntos de corte para cargas factoriales: una perspectiva de fiabilidad de constructo. Enfermería Clínica, 28(6). https://doi.org/10.1016/j.enfcli.2018.06.002
Fajkowska, M., Domaradzka, E., & Wytykowska, A. (2018). Types of Anxiety and Depression: Theoretical Assumptions and Development of the Anxiety and Depression Questionnaire. Frontiers in Psychology, 8. https://doi.org/10.3389/fpsyg.2017.02376
Ferrando, P. J., & Anguiano-Carrasco, C. (2010). El análisis factorial como técnica de investigación en psicología. Papeles del Psicólogo, 31(1). https://www.papelesdelpsicologo.es/resumen?pii=1793
Gao, W., Ping, S., & Liu, X. (2020). Gender Differences in Depression, Anxiety, and Stress Among College Students: A Longitudinal Study from China. Journal of Affective Disorders, 263. https://doi.org/10.1016/j.jad.2019.11.121
Goldberg, D. P. (1972). The Detection of Psychiatric Illness by Questionnaire. Oxford University Press.
Guerra, V. L., Mejia, Á. J. A., & Alcedo, J. M. G. (2022). Psychometric Properties and Factorial Structure of the Patient Health Questionnaire (PHQ-4) in Ecuadorian University Students. Revista Cubana de Enfermeria, 38(3).
Hermosa-Bosano, C., Paz, C., Hidalgo-Andrade, P., García-Manglano, J., Sádaba-Chalezquer, C., López-Madrigal, C., & Serrano, C. (2021). Síntomas de depresión, ansiedad y estrés en la población general ecuatoriana durante la pandemia por covid-19. Revista Ecuatoriana de Neurología, 30(2). https://doi.org/10.46997/revecuatneurol30200040
Huang, Y., Li, Y., Pan, H., & Han, L. (2023). Global, Regional, and National Burden of Neurological Disorders in 204 Countries and Territories Worldwide. Journal of Global Health, 13. https://doi.org/10.7189/JOGH.13.04160
Hyde, J. S., & Mezulis, A. H. (2020). Gender Differences in Depression: Biological, Affective, Cognitive, and Sociocultural Factors. Harvard Review of Psychiatry, 28(1), 4-13. https://doi.org/10.1097/hrp.0000000000000230
Kazlauskas, E., Gelezelyte, O., Kvedaraite, M., Ajdukovic, D., Johannesson, K. B., Böttche, M., Bondjers, K., Dragan, M., Figueiredo-Braga, M., Grajewski, P., Anastassiou-Hadjicharalambous, X., Javakhishvili, J. D., Lioupi, C., Lueger-Schuster, B., Mouthaan, J., Bagaric, I. R., Sales, L., Schäfer, I., Soydas, S., … Lotzin, A. (2023). Psychometric Properties of the Patient Health Questionnaire-4 (PHQ-4) in 9.230 Adults across Seven European Countries: Findings from the ESTSS ADJUST Study. Journal of Affective Disorders, 335, 18-23. https://doi.org/10.1016/j.jad.2023.05.007
Kroenke, K., Spitzer, R. L., & Williams, J. B. W. (2001). The PHQ-9: Validity of a Brief Depression Severity Measure. Journal of General Internal Medicine, 16(9). https://doi.org/10.1046/j.1525-1497.2001.016009606.x
Kroenke, K., Spitzer, R. L., Williams, J. B. W., & Löwe, B. (2009). An Ultra-brief Screening Scale for Anxiety and Depression: The PHQ–4. Psychosomatics, 50(6). https://doi.org/10.1016/s0033-3182(09)70864-3
Lapo-Talledo, G. J., Montes-Escobar, K., Rodrigues, A. L. S., & Siteneski, A. (2025). Hospitalizations for Depressive Disorders in Ecuador: An Eight-year Nationwide Analysis of Trends and Demographic Insights. Journal of Affective Disorders, 374, 433-442. https://doi.org/10.1016/J.JAD.2025.01.074
Larionow, P., & Mudło-Głagolska, K. (2023). The Patient Health Questionnaire-4: Factor Structure, Measurement Invariance, Latent Profile Analysis of Anxiety and Depressive Symptoms and Screening Results in Polish Adults. Advances in Cognitive Psychology, 19(2). https://doi.org/10.5709/acp-0391-2
Li, C. H. (2016). Confirmatory Factor Analysis with Ordinal Data: Comparing Robust Maximum Likelihood and Diagonally Weighted Least Squares. Behavior Research Methods, 48(3). https://doi.org/10.3758/s13428-015-0619-7
Li, L., Niu, Z., Mei, S., & Griffiths, M. D. (2022). A Network Analysis Approach to the Relationship Between Fear of Missing Out (Fomo), Smartphone Addiction, and Social Networking Site Use among a Sample of Chinese University Students. Computers in Human Behavior, 128. https://doi.org/10.1016/j.chb.2021.107086
Lovibond, S. H., & Lovibond, P. F. (1995). Manual for the Depression, Anxiety and Stress Scale-21 Items (DASS-21). Psychology Foundation of Australia.
Luong, R., & Flake, J. K. (2023). Measurement Invariance Testing using Confirmatory Factor Analysis and Alignment Optimization: A Tutorial for Transparent Analysis Planning and Reporting. Psychological Methods, 28(4), 905-924. https://doi.org/10.1037/met0000441
Mardia, K. V. (1970). Measures of Multivariate Skewness and Kurtosis with Applications. Biometrika, 57(3), 519. https://doi.org/10.1093/biomet/57.3.519
McGuinness, T. M., Dyer, J. G., & Wade, E. H. (2012). Gender Differences in Adolescent Depression. Journal of Psychosocial Nursing and Mental Health Services, 50(12). https://doi.org/10.3928/02793695-20121107-04
Mendoza, N. B., Frondozo, C. E., Dizon, J. I. W. T., & Buenconsejo, J. U. (2024). The Factor Structure and Measurement Invariance of the PHQ-4 and the Prevalence of Depression and Anxiety in a Southeast Asian Context amid the covid-19 Pandemic. Current Psychology, 43(25). https://doi.org/10.1007/s12144-022-02833-5
Mills, S. D., Fox, R. S., Pan, T. M., Malcarne, V. L., Roesch, S. C., & Sadler, G. R. (2015). Psychometric Evaluation of the Patient Health Questionnaire–4 in Hispanic Americans. Hispanic Journal of Behavioral Sciences, 37(4). https://doi.org/10.1177/0739986315608126
Moreno-Montero, E., Moreta-Herrera, R., Rodas, J. A., Oriol-Granado, X., Puerta-Cortés, D. X., Ferrufino-Borja, D., Diaz, R. G., Rivera, M. E. L., Samaniego-Pinho, A., Buenahora-Bernal, M., Rojas-Jara, C., & Vega-Arce, M. (2025). Cross-cultural Measurement Equivalence of the Seven-item General Anxiety Disorder Scale (GAD-7) in College Students of Six Countries of Latin American. Journal of Affective Disorders, 380, 598-606. https://doi.org/10.1016/J.JAD.2025.03.188
Moreta-Herrera, R., Caycho-Rodríguez, T., Salinas, A., Jiménez-Borja, M., Gavilanes-Gómez, D., & Jiménez-Mosquera, C. J. (2025). Factorial Validity, Reliability, Measurement Invariance and the Graded Response Model for the covid-19 Anxiety Scale in a Sample of Ecuadorians. Omega, 90(3), 1078-1093. https://doi.org/10.1177/00302228221116515
Moreta-Herrera, R., Dominguez-Lara, S., Vaca-Quintana, D., Zambrano-Estrella, J., Gavilanes-Gómez, D., Ruperti-Lucero, E., & Bonilla, D. (2021). Psychometric Properties of the General Health Questionnaire (GHQ-28) in Ecuadorian College Students. Psihologijske Teme, 30(3). https://doi.org/10.31820/pt.30.3.9
Moreta-Herrera, R., López-Calle, C., Caycho-Rodríguez, T., Cabezas Guerra, C., Gallegos, M., Cervigni, M., Martino, P., Barés, I., & Calandra, M. (2022). Is it Possible to Find a Bifactor Structure in the Fear of covid-19 Scale (FCV-19S)? Psychometric Evidence in an Ecuadorian Sample. Death Studies, 46(9). https://doi.org/10.1080/07481187.2021.1914240
Moreta-Herrera, R., Rodríguez-Lorenzana, A., Mascialino, G., Castro-Ochoa, F., Narváez-Pillco, V., Caycho-Rodríguez, T., & Mayorga-Lascano, M. (2024). Psychometric Properties of the 28-item General Health Scale (GHQ-28). Analysis from the Classical Test and Item Response Theories in Ecuadorian University Students. Psychology Hub, 41(3), 43-54. https://doi.org/10.13133/2724-2943/18460
R Core Team. (2024). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.r-project.org/
Rutakumwa, R., Tusiime, C., Mpango, R. S., Kyohangirwe, L., Kaleebu, P., Patel, V., & Kinyanda, E. (2023). A Qualitative Exploration of Causes of Depression among Persons Living with HIV Receiving Antiretroviral Therapy in Uganda: Implications for Policy. Psychiatry Journal. https://doi.org/10.1155/2023/1986908
Rutkowski, L., & Svetina, D. (2017). Measurement Invariance in International Surveys: Categorical Indicators and Fit Measure Performance. Applied Measurement in Education, 30(1). https://doi.org/10.1080/08957347.2016.1243540
Sánchez-Vélez, H., & Moreta-Herrera, R. (2022). Fear and Anxiety of covid-19, Stress and Health Perception. A Predictive Model in Ecuadorian Hospital Patients. Anales de Psicología, 38(3), 439-447. https://doi.org/10.6018/analesps.489761
Simancas-Pallares, M., Díaz-Cárdenas, S., Barbosa-Gómez, P., Buendía-Vergara, M., & Arévalo-Tovar, L. (2016). Propiedades psicométricas del Índice de Bienestar General-5 de la Organización Mundial de la Salud en pacientes parcialmente edéntulos. Revista de la Facultad de Medicina, 64(4). https://doi.org/10.15446/revfacmed.v64n4.52235
Şimşek, G. G., & Noyan, F. (2013). McDonald’s ωt, Cronbach’s α, and Generalized θ for Composite Reliability of Common Factors Structures. Communications in Statistics - Simulation and Computation, 42(9). https://doi.org/10.1080/03610918.2012.689062
Spielberger, C. D., Gorsuch, R. L., & Lushene, R. E. (1970). Manual for the State-Trait Anxiety Inventory (Self-Evaluation Questionnaire). Consulting Psychologists Press.
Spitzer, R. L., Kroenke, K., & Williams, J. B. W. (1999). Validation and Utility of a Self-report Version of PRIME-MD: The PHQ Primary Care Study. Journal of the American Medical Association, 282(18). https://doi.org/10.1001/jama.282.18.1737
Wolf, E. J., Harrington, K. M., Clark, S. L., & Miller, M. W. (2013). Sample Size Requirements for Structural Equation Models: An Evaluation of Power, Bias, and Solution Propriety. Educational and Psychological Measurement, 73(6). https://doi.org/10.1177/0013164413495237
World Health Organization. (2022). World Mental Health Report: Transforming Mental Health for all. Executive Summary. https://www.who.int/publications/i/item/9789240049338
World Health Organization (2024). The World Health Organization-Five Well-Being Index (WHO-5). https://www.who.int/publications/m/item/WHO-UCN-MSD-MHE-2024.01
Yang-Wallentin, F., Jöreskog, K. G., & Luo, H. (2010). Confirmatory Factor Analysis of Ordinal Variables with Misspecified Models. Structural Equation Modeling, 17(3). https://doi.org/10.1080/10705511.2010.489003
Yildirim, M., Gaynes, B. N., Keskinocak, P., Pence, B. W., & Swann, J. (2022). DIP: Natural history model for major depression with incidence and prevalence. Journal of Affective Disorders, 296. https://doi.org/10.1016/j.jad.2021.09.079
Zung, W. W. K. (1986). Zung Self-Rating Depression Scale and Depression Status Inventory. Assessment of Depression. https://doi.org/10.1007/978-3-642-70486-4_21
Data availabilty: The data set supporting the results of this study is not available.
Funding: This study did not receive any external funding or financial support.
Conflicts of interest: The authors declare that they have no conflicts
of interest.
How to cite: Cuesta-Andaluz, E., Moreta-Herrera, R., Moya-Solís, A., Santillán-García, N., & Moreno-Montero, E. (2025). Psychometric Properties of the Patient Health Questionnaire-4 in a Sample of Adults from Ecuador. Ciencias Psicológicas, 19(2), e-4481. https://doi.org/10.22235/cp.v19i2.4481
Authors’ contribution (CRediT Taxonomy): 1. Conceptualization; 2. Data curation; 3. Formal Analysis; 4. Funding acquisition; 5. Investigation; 6. Methodology; 7. Project administration; 8. Resources; 9. Software; 10. Supervision; 11. Validation; 12. Visualization; 13. Writing: original draft; 14. Writing: review & editing.
E. C. A. has contributed in 1, 2, 3, 6, 9, 11, 12, 13, 14; R. M. H. in 1, 2, 3, 5, 6, 9, 10, 12, 13, 14; A. M. S. in 3, 5, 6, 8, 11, 13, 14; N. S. G. in 3, 5, 6, 8, 11, 13, 14; E. M. M. in 1, 2, 3, 6, 9, 11, 12, 13, 14.
Scientific editor in-charge: Dr. Cecilia Cracco.
Ciencias Psicológicas; v19(2)
July-December 2025
10.22235/cp.v19i2.4481