Adicionalmente, en este estudio se construyen dos índices de salud para aproximar la prevalencia de síntomas inflamatorios. Estos se calculan utilizando una metodología de correspondencias múltiples (ver, por ejemplo, \citealt{trevor1987}). Este método se utiliza para detectar y representar estructuras subyacentes en un conjunto de datos del tipo categórico, a la vez que permite resumir una gran cantidad de datos en un número reducido de dimensiones. Las dimensiones resultantes representan la misma información que las variables originales, en el sentido que podemos recuperar la base de datos original a partir de la base transformada. Asimismo, la varianza total entre ambas bases de datos es la misma.
Para el primer índice se realiza un análisis de correspondencias múltiples para todas las variables relacionadas con la salud en la Tabla \ref{tab:statistics}. La Figura \ref{472205}, parte superior, muestra un gráfico de sedimentación que incluye las nueve dimensiones resultantes y la aportación de cada una de estas a la varianza total. En el modelo econométrico de la depresión, se considera solo la primera dimensión, la cual aporta el 23% de la varianza total de las variables originales y puede considerarse como un resumen de las enfermedades que podrían causar los síntomas inflamatorios.