Ejemplos cálculo p
Ejemplo 1: Correlación positiva moderada
Descripción: Estudiamos la relación entre el número de horas de ejercicio semanal y el nivel de energía reportado por las personas.
import numpy as np
from scipy.stats import pearsonr
# Datos: Horas de ejercicio y nivel de energía
horas_ejercicio = [0, 2, 3, 5, 7, 8, 10, 12, 14, 15]
nivel_energia = [20, 25, 30, 40, 50, 55, 70, 80, 85, 90]
# Calcular la correlación de Pearson
correlacion, p_valor = pearsonr(horas_ejercicio, nivel_energia)
print(f"Coeficiente de correlación de Pearson: {correlacion:.4f}")
print(f"Valor p: {p_valor:.4f}")
Ejemplo 2: Correlación negativa moderada
Descripción: Estudiamos la relación entre el consumo de alcohol y el rendimiento académico en estudiantes.
import numpy as np
from scipy.stats import pearsonr
# Datos: Consumo de alcohol (bebidas por semana) y rendimiento académico (promedio de calificaciones)
consumo_alcohol = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
rendimiento_academico = [90, 88, 85, 83, 80, 75, 70, 65, 60, 50]
# Calcular la correlación de Pearson
correlacion, p_valor = pearsonr(consumo_alcohol, rendimiento_academico)
print(f"Coeficiente de correlación de Pearson: {correlacion:.4f}")
print(f"Valor p: {p_valor:.4f}")
Ejemplo 3: Sin correlación
Descripción: Analizamos la relación entre la cantidad de helados vendidos y la cantidad de días lluviosos en un mes.
import numpy as np
from scipy.stats import pearsonr
# Datos: Helados vendidos y días lluviosos
helados_vendidos = [100, 150, 120, 130, 160, 140, 110, 180, 200, 190]
dias_lluviosos = [2, 3, 1, 4, 5, 2, 3, 1, 2, 4]
# Calcular la correlación de Pearson
correlacion, p_valor = pearsonr(helados_vendidos, dias_lluviosos)
print(f"Coeficiente de correlación de Pearson: {correlacion:.4f}")
print(f"Valor p: {p_valor:.4f}")
Ejemplo 4: Correlación positiva muy fuerte
Descripción: Relación entre las temperaturas diarias y el consumo de energía para climatización.
import numpy as np
from scipy.stats import pearsonr
# Datos: Temperatura (°C) y consumo de energía (kWh)
temperaturas = [20, 22, 24, 26, 28, 30, 32, 34, 36, 38]
consumo_energia = [200, 220, 250, 300, 350, 400, 450, 500, 600, 700]
# Calcular la correlación de Pearson
correlacion, p_valor = pearsonr(temperaturas, consumo_energia)
print(f"Coeficiente de correlación de Pearson: {correlacion:.4f}")
print(f"Valor p: {p_valor:.4f}")
Ejemplo 5: Correlación negativa débil
Descripción: Estudio de la relación entre el tiempo dedicado a ver televisión y el tiempo dedicado a la lectura.
import numpy as np
from scipy.stats import pearsonr
# Datos: Horas de televisión y horas de lectura
horas_television = [5, 4, 6, 7, 8, 4, 3, 5, 2, 1]
horas_lectura = [1, 2, 1, 0, 0, 2, 3, 1, 4, 5]
# Calcular la correlación de Pearson
correlacion, p_valor = pearsonr(horas_television, horas_lectura)
print(f"Coeficiente de correlación de Pearson: {correlacion:.4f}")
print(f"Valor p: {p_valor:.4f}")
Interpretación de los resultados
- Ejemplo 1: Se espera que la correlación sea positiva y moderada, lo que sugiere que a medida que aumentan las horas de ejercicio, también aumenta el nivel de energía.
- Ejemplo 2: Aquí, se espera una correlación negativa, indicando que un mayor consumo de alcohol se asocia con un menor rendimiento académico.
- Ejemplo 3: Se espera que el coeficiente de correlación sea cercano a 0, indicando que no hay correlación entre las variables.
- Ejemplo 4: Este caso debería resultar en una correlación muy fuerte, reflejando la relación positiva entre temperatura y consumo de energía para climatización.
- Ejemplo 5: Debería resultar en una correlación negativa débil, sugiriendo que hay una leve tendencia a que más tiempo viendo televisión se asocie con menos tiempo leyendo.
Estos ejemplos ilustran cómo calcular la correlación de Pearson y cómo interpretarla en diferentes contextos.