Tipos y Análisis de Variables en una Investigación

Autor: David García Marín

Si estás realizando un TFG, TFM o cualquier trabajo académico que requiera un análisis estadístico, es fácil sentirse abrumado por la gran cantidad de métodos y variables existentes. Por ello elaboramos nuestra Guía de Investigación Bibliográfica (ver AQUÍ) y por ese mismo motivo hemos decidido elaborar este artículo.

Con esta pequeña guía, elaborada por Sandra Redondo -Graduada en Psicología y analista especializada en psicometría y análisis de datos- y coordinada por Marta Mallavibarrena -Psicóloga y Analista de Inteligencia-, del área de Data Science de Sec2Crime, pretendemos ayudarte a identificar con qué tipo de variables estás trabajando, así como los análisis más adecuados para realizar sobre ellas.

Por otro lado, te invitamos a visitar nuestro artículo sobre las mejores herramientas digitales de investigación, que te podrían servir como complemento al material que te aportamos a continuación.

Puedes ampliar información sobre el análisis de datos en ciencias sociales, análisis estadísticos e investigación con variables en:
  • Pardo Merino, A., & San Martin, R. (2010). Análisis de datos en ciencias sociales y de la salud II. Madrid: EDITORIAL SINTESIS, S.A.
  • Pardo Merino, A., Ruiz Diaz, M. A., & San Martin, R. (2009). Análisis de datos en ciencias sociales y de la salud I. Madrid: EDITORIAL SINTESIS, S.A.

IDENTIFICACIÓN DE VARIABLES

El primer paso es identificar qué tipo de variables tenemos. Para ello se pueden diferenciar hasta 4 niveles. Una vez que sepamos a qué nivel pertenece será más fácil averiguar de qué tipo de variable se trata (categórica o cuantitativa).

Los niveles pueden ser:

NOMINAL

  • Este tipo de nivel se utiliza sobre todo en variables categóricas (de dos categorías o dicotómicas), por ejemplo, para la variable “Estudios” se podría indicar si la persona tiene estudios o no. Normalmente las etiquetas para estas variables suelen ser 0 (p.e. sin estudios) y 1 (p.e. con estudios); pero si se quiere realizar una tabla de contingencia se etiquetan con 1 y 2.

ORDINAL

Este tipo de nivel también se suele utilizar para variables categóricas (de más de dos categorías o politómicas). Las cantidades ordinales hacen referencia a que la distancia entre una etiqueta y otra no siempre es la misma. Si seguimos con el ejemplo de la variable “Estudios”, en este caso se podrían tener 5 etiquetas, 0 para “Estudios primarios”, 1 para “E.S.O.”, 2 para “Bachillerato”, 3 para “Grado universitario” y 4 para “Máster”. Como se puede observar en cada nivel de estudios hay una “distancia” diferente, los “estudios primarios” son 6, “E.S.O.” son 4, etc.

DE INTERVALO

Este tipo de nivel se suele utilizar con variables cuantitativas, donde la “distancia” es siempre la misma, pero sin el 0 absoluto (ausencia de la característica). Por ejemplo, la temperatura, ya que la “distancia” entre 5º y 6º es la misma que entre 99º y 100º (1º grado).

DE RAZÓN

Este tipo de nivel se suele utilizar con variables cuantitativas. A diferencia de las variables de intervalo, en este caso si se incluye el 0 absoluto. Por ejemplo, el peso, ya que una persona que pese 100 Kg pesa más que una de 94 Kg. En este caso si alguien pesara 0 Kg indicaría que esa persona no tiene peso. Por otro lado tampoco hay pesos negativos (nadie puede pesar -50 Kg).

TIPOS DE VARIABLES

Una vez que ya sabemos qué nivel tiene(n) nuestra variable(s), lo segundo es estudiar su naturaleza, gracias a los análisis descriptivos. Cómo ya se ha nombrado antes, existen 2 tipos de variables, categóricas y cuantitativas.

VARIABLES CATEGÓRICAS

Las variables categóricas, como su propio nombre indica, hacen referencia a las diferentes categorías que puede tomar una variable. En este caso los análisis descriptivos más relevantes son las frecuencias absolutas y relativas (o acumuladas); con las frecuencias acumuladas se pueden ver los percentiles y observar cómo se distribuye la variable.

Para poder representar estas cantidades se suelen utilizar gráficos de barras o de sectores.

VARIABLES CUANTITATIVAS

Las variables cuantitativas, hacen referencia a cantidades. En este caso los análisis descriptivos se utilizan para estudiar su centro, dispersión y forma:

  • El centro: hace referencia al promedio de dicha variable (ya sea con la media o la mediana). Se pueden realizar diferentes pruebas estadísticas para saber si la media (o mediana) es igual a determinado valor, por ejemplo, que la media sea igual a 50.
  • La dispersión: hace referencia a si el centro es representativo (con la desviación típica, es decir, a cuántas desviaciones de encuentra de la media)
  • La forma de la distribución: se observa mediante un histograma (que muestra si la forma de la distribución es leptocúrtica, mesocúritca o platicúrtica) y los índices de asimetría y curtosis. Si el índice de asimetría obtiene una puntuación Z que se encuentra entre -2 y 2 indica que hay simetría.
A su vez también se encuentra la prueba de Kolmogorov-Smirnov (si se rechaza H0 la variable no cumple la normalidad) o la prueba de Shapiro-Wilk para muestras pequeñas. En el descargable que tienes al principio de la página encontrarás algunos ejemplos de variables cuantitativas y ejemplos de variables categóricas.