Tipos y Análisis de Variables en una Investigación
Autor: David García Marín
Si estás realizando un TFG, TFM o cualquier trabajo académico que requiera un análisis estadístico, es fácil sentirse abrumado por la gran cantidad de métodos y variables existentes. Por ello elaboramos nuestra Guía de Investigación Bibliográfica (ver AQUÍ) y por ese mismo motivo hemos decidido elaborar este artículo.
Con esta pequeña guía, elaborada por Sandra Redondo -Graduada en Psicología y analista especializada en psicometría y análisis de datos- y coordinada por Marta Mallavibarrena -Psicóloga y Analista de Inteligencia-, del área de Data Science de Sec2Crime, pretendemos ayudarte a identificar con qué tipo de variables estás trabajando, así como los análisis más adecuados para realizar sobre ellas.
Por otro lado, te invitamos a visitar nuestro artículo sobre las mejores herramientas digitales de investigación, que te podrían servir como complemento al material que te aportamos a continuación.
- Pardo Merino, A., & San Martin, R. (2010). Análisis de datos en ciencias sociales y de la salud II. Madrid: EDITORIAL SINTESIS, S.A.
- Pardo Merino, A., Ruiz Diaz, M. A., & San Martin, R. (2009). Análisis de datos en ciencias sociales y de la salud I. Madrid: EDITORIAL SINTESIS, S.A.
IDENTIFICACIÓN DE VARIABLES
El primer paso es identificar qué tipo de variables tenemos. Para ello se pueden diferenciar hasta 4 niveles. Una vez que sepamos a qué nivel pertenece será más fácil averiguar de qué tipo de variable se trata (categórica o cuantitativa).
Los niveles pueden ser:
NOMINAL
- Este tipo de nivel se utiliza sobre todo en variables categóricas (de dos categorías o dicotómicas), por ejemplo, para la variable “Estudios” se podría indicar si la persona tiene estudios o no. Normalmente las etiquetas para estas variables suelen ser 0 (p.e. sin estudios) y 1 (p.e. con estudios); pero si se quiere realizar una tabla de contingencia se etiquetan con 1 y 2.
ORDINAL
Este tipo de nivel también se suele utilizar para variables categóricas (de más de dos categorías o politómicas). Las cantidades ordinales hacen referencia a que la distancia entre una etiqueta y otra no siempre es la misma. Si seguimos con el ejemplo de la variable “Estudios”, en este caso se podrían tener 5 etiquetas, 0 para “Estudios primarios”, 1 para “E.S.O.”, 2 para “Bachillerato”, 3 para “Grado universitario” y 4 para “Máster”. Como se puede observar en cada nivel de estudios hay una “distancia” diferente, los “estudios primarios” son 6, “E.S.O.” son 4, etc.
DE INTERVALO
Este tipo de nivel se suele utilizar con variables cuantitativas, donde la “distancia” es siempre la misma, pero sin el 0 absoluto (ausencia de la característica). Por ejemplo, la temperatura, ya que la “distancia” entre 5º y 6º es la misma que entre 99º y 100º (1º grado).
DE RAZÓN
Este tipo de nivel se suele utilizar con variables cuantitativas. A diferencia de las variables de intervalo, en este caso si se incluye el 0 absoluto. Por ejemplo, el peso, ya que una persona que pese 100 Kg pesa más que una de 94 Kg. En este caso si alguien pesara 0 Kg indicaría que esa persona no tiene peso. Por otro lado tampoco hay pesos negativos (nadie puede pesar -50 Kg).
TIPOS DE VARIABLES
Una vez que ya sabemos qué nivel tiene(n) nuestra variable(s), lo segundo es estudiar su naturaleza, gracias a los análisis descriptivos. Cómo ya se ha nombrado antes, existen 2 tipos de variables, categóricas y cuantitativas.
VARIABLES CATEGÓRICAS
Las variables categóricas, como su propio nombre indica, hacen referencia a las diferentes categorías que puede tomar una variable. En este caso los análisis descriptivos más relevantes son las frecuencias absolutas y relativas (o acumuladas); con las frecuencias acumuladas se pueden ver los percentiles y observar cómo se distribuye la variable.
Para poder representar estas cantidades se suelen utilizar gráficos de barras o de sectores.
VARIABLES CUANTITATIVAS
Las variables cuantitativas, hacen referencia a cantidades. En este caso los análisis descriptivos se utilizan para estudiar su centro, dispersión y forma:
- El centro: hace referencia al promedio de dicha variable (ya sea con la media o la mediana). Se pueden realizar diferentes pruebas estadísticas para saber si la media (o mediana) es igual a determinado valor, por ejemplo, que la media sea igual a 50.
- La dispersión: hace referencia a si el centro es representativo (con la desviación típica, es decir, a cuántas desviaciones de encuentra de la media)
- La forma de la distribución: se observa mediante un histograma (que muestra si la forma de la distribución es leptocúrtica, mesocúritca o platicúrtica) y los índices de asimetría y curtosis. Si el índice de asimetría obtiene una puntuación Z que se encuentra entre -2 y 2 indica que hay simetría.