En las caminatas que realizamos tenía la impresión de que a las salidas nivel 3 y 4 o salidas exigentes, asistían más hombres que mujeres. No me quedé con la duda, y analicé si había relación entre las variables nivel de caminata y cantidad de mujeres que asisten a ella. A continuación les comparto lo que encontré:

Dado que las personas tienen condición física diferente, hemos categorizado las caminatas por niveles, de 1 a 4, siendo el nivel 1 caminatas para principiantes o personas sedentarias y el nivel 4, para caminantes avanzados o personas que realizan por lo menos 3 veces ejercicio durante la semana; en el siguiente enlace se pueden ver los niveles que manejamos: Niveles Caminatas Ecológicas.

Variable Dependiente

La variable que deseo predecir o estimar es la cantidad de mujeres que asisten por nivel de caminata, lo que la convierte en la variable dependiente.

Variable Independiente

Dado que el nivel de caminata proporciona la base para la estimación, esta será la variable independiente.

Datos usados para el análisis

Los datos que se muestran a continuación corresponden a las salidas realizadas por Picoloro Ecoturismo durante el año 2012.

Datos de Análisis

ANÁLISIS DE CORRELACIÓN

Los datos que se muestran a continuación fueron el resultado del paquete estadístico CurveExpert.

Análisis de Correlación

Análisis de Correlación

Se observa que el coeficiente de correlación r es 0.384, lo cual indica que si bien hay una relación entre las variables nivel de caminata y cantidad de mujeres que asisten, esta no es muy fuerte.

Esta es la gráfica que relaciona las variables nivel de caminata y cantidad de mujeres que asisten.

Análisis de Correlación

Esperaba una relación más fuerte al relacionar estas dos variables.

PRUEBA DE SIGNIFICANCIA PARA EL COEFICIENTE DE CORRELACIÓN

Con la prueba de significancia, queremos probar que en realidad exista una correlación entre las variables, y que no por haber realizado una muestra, las variables en realidad no estén relacionadas. Por esta razón, probaremos si puede haber una correlación cero entre la población de la que se seleccionó la muestra.

Prueba de significancia para el coeficiente de correlación

Con un nivel de significancia de 0,05, la regla de decisión indica que si el valor calculado t se encuentra entre – 2,093 y + 2,093, no se rechaza la hipótesis nula, es decir, la correlación entre las variables nivel de caminata y cantidad de mujeres que asisten a las salidas es cero.

Consultando una tabla de distribución t de Student para 19 grados de libertad (n – 2 = 21 – 2 = 19) con un nivel de significancia de 0,05, tenemos un valor crítico de 2,093.

Obtenemos el valor para t de la siguiente manera:

r = 0,384 (coeficiente de relación)
n = 21

Prueba de significancia para el coeficiente de correlación

El valor t calculado se encuentra en la región donde no se rechaza la hipótesis nula con un nivel de significancia de 0.05.

Lo anterior indica que no existe una correlación entre el nivel de caminata y la cantidad de mujeres que asisten a las caminatas, en la población de caminantes de la ciudad de Cali.

ANÁLISIS DE REGRESIÓN

El paquete estadístico CurveExpert dio como resultado los siguientes datos:

Análisis de Regresión

La ecuación general de regresión lineal es:

Análisis de Regresión

Para obtener la pendiente de la recta tenemos la siguiente ecuación:

Análisis de Regresión

Tenemos todas las variables, las cuales fueron resultado del paquete estadístico CurveExpert.

Análisis de Regresión

De esta manera realizamos el cálculo y tenemos que la pendiente es:

Análisis de Regresión

Con las medias de cada variable en evaluación, obtendremos el valor de a de la siguiente manera, basándonos en la ecuación general de regresión lineal:

Análisis de Regresión

De esta manera, tenemos que la ecuación resultante es

Análisis de Regresión

PRUEBA DE SIGNIFICANCIA PARA EL COEFICIENTE DE REGRESIÓN

A continuación se probará que la pendiente de la ecuación sea distinta de cero, para ello, se proponen las siguientes hipótesis nula y alternativa.

Prueba de significancia para el coeficiente de regresión

Donde beta representa la pendiente de la población de la ecuación de regresión.

Realizamos el siguiente cálculo para probar la hipótesis nula:

Prueba de significancia para el coeficiente de regresión

Para 19 grados de libertad (n – 2 = 21 – 2 = 19) y utilizando un nivel de significancia de 0,05, tenemos un valor crítico de 1,729.

La regla de decisión es rechazar la hipótesis nula si el valor calculado es mayor a 1,729, la cual es la región de rechazo.

De acuerdo con los resultados de CurveExpert, el error estándar de la estimación de la pendiente es 1,919827, por lo cual tenemos el siguiente cálculo:

Prueba de significancia para el coeficiente de regresión

El valor calculado de 0,9006 no excede el valor crítico de 1,729, por lo tanto se acepta la hipótesis nula.

Por lo anterior, se concluye que la pendiente de la recta de regresión de la población puede ser cero, lo cual significa que la variable independiente nivel de caminata no tiene valor para estimar la variable dependiente cantidad de mujeres que asisten a las caminatas.

CONCLUSIÓN

Conocer el nivel de caminata no ayuda a predecir la cantidad de mujeres que asisten a un caminata determinada.

REFERENCIAS BIBLIOGRÁFICAS

Lind, Douglas. Estadística Aplicada a los Negocios y la Economía. Mc Graw Hill, 15va edición.

por RENÉ ALEJANDRO HUERTAS CAICEDO
Director General Picoloro Ecoturismo