Ejercicios resueltos
Aquí tienes tres ejercicios con conjuntos de datos diferentes, cada uno con su respectivo código en Python para calcular las medidas descriptivas.
Ejercicio 1: Puntuaciones de un Examen
Conjunto de Datos: Puntuaciones obtenidas por 15 estudiantes en un examen.
- Datos: 65, 72, 88, 90, 75, 80, 62, 78, 85, 94, 82, 88, 73, 81, 79
Código
import numpy as np
import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
# Datos
scores_examen = [65, 72, 88, 90, 75, 80, 62, 78, 85, 94, 82, 88, 73, 81, 79]
# Convertir a un array de numpy
scores_array_examen = np.array(scores_examen)
# 1. Media
mean_examen = np.mean(scores_array_examen)
# 2. Mediana
median_examen = np.median(scores_array_examen)
# 3. Moda
mode_examen = stats.mode(scores_array_examen)[0]
# 4. Rango
data_range_examen = np.ptp(scores_array_examen)
# 5. Varianza
variance_examen = np.var(scores_array_examen, ddof=0)
# 6. Desviación Estándar
std_deviation_examen = np.std(scores_array_examen, ddof=0)
# 7. Tabla de Frecuencia
frequency_table_examen = pd.Series(scores_examen).value_counts().sort_index()
# Resultados
print("Ejercicio 1: Puntuaciones de un Examen")
print(f"Media: {mean_examen}")
print(f"Mediana: {median_examen}")
print(f"Moda: {mode_examen}")
print(f"Rango: {data_range_examen}")
print(f"Varianza: {variance_examen}")
print(f"Desviación Estándar: {std_deviation_examen}")
print("\nTabla de Frecuencia:")
print(frequency_table_examen)
# Gráfico de Histograma
plt.hist(scores_array_examen, bins=10, edgecolor='black')
plt.title('Histograma de Puntuaciones de un Examen')
plt.xlabel('Puntuaciones')
plt.ylabel('Frecuencia')
plt.show()
Ejercicio 2: Temperaturas Diarias
Conjunto de Datos: Temperaturas diarias (en grados Celsius) registradas durante una semana.
- Datos: 22, 25, 21, 23, 26, 24, 27
Código
# Datos
temperaturas = [22, 25, 21, 23, 26, 24, 27]
# Convertir a un array de numpy
temperaturas_array = np.array(temperaturas)
# 1. Media
mean_temperaturas = np.mean(temperaturas_array)
# 2. Mediana
median_temperaturas = np.median(temperaturas_array)
# 3. Moda
mode_temperaturas = stats.mode(temperaturas_array)[0]
# 4. Rango
data_range_temperaturas = np.ptp(temperaturas_array)
# 5. Varianza
variance_temperaturas = np.var(temperaturas_array, ddof=0)
# 6. Desviación Estándar
std_deviation_temperaturas = np.std(temperaturas_array, ddof=0)
# 7. Tabla de Frecuencia
frequency_table_temperaturas = pd.Series(temperaturas).value_counts().sort_index()
# Resultados
print("\nEjercicio 2: Temperaturas Diarias")
print(f"Media: {mean_temperaturas}")
print(f"Mediana: {median_temperaturas}")
print(f"Moda: {mode_temperaturas}")
print(f"Rango: {data_range_temperaturas}")
print(f"Varianza: {variance_temperaturas}")
print(f"Desviación Estándar: {std_deviation_temperaturas}")
print("\nTabla de Frecuencia:")
print(frequency_table_temperaturas)
# Gráfico de Histograma
plt.hist(temperaturas_array, bins=5, edgecolor='black')
plt.title('Histograma de Temperaturas Diarias')
plt.xlabel('Temperaturas (°C)')
plt.ylabel('Frecuencia')
plt.show()
Ejercicio 3: Altura de Plantas
Conjunto de Datos: Alturas (en cm) de un grupo de 12 plantas después de 4 semanas.
- Datos: 30, 32, 35, 28, 31, 36, 33, 30, 34, 29, 31, 32
Código
# Datos
alturas_plantas = [30, 32, 35, 28, 31, 36, 33, 30, 34, 29, 31, 32]
# Convertir a un array de numpy
alturas_array = np.array(alturas_plantas)
# 1. Media
mean_alturas = np.mean(alturas_array)
# 2. Mediana
median_alturas = np.median(alturas_array)
# 3. Moda
mode_alturas = stats.mode(alturas_array)[0]
# 4. Rango
data_range_alturas = np.ptp(alturas_array)
# 5. Varianza
variance_alturas = np.var(alturas_array, ddof=0)
# 6. Desviación Estándar
std_deviation_alturas = np.std(alturas_array, ddof=0)
# 7. Tabla de Frecuencia
frequency_table_alturas = pd.Series(alturas_plantas).value_counts().sort_index()
# Resultados
print("\nEjercicio 3: Altura de Plantas")
print(f"Media: {mean_alturas}")
print(f"Mediana: {median_alturas}")
print(f"Moda: {mode_alturas}")
print(f"Rango: {data_range_alturas}")
print(f"Varianza: {variance_alturas}")
print(f"Desviación Estándar: {std_deviation_alturas}")
print("\nTabla de Frecuencia:")
print(frequency_table_alturas)
# Gráfico de Histograma
plt.hist(alturas_array, bins=5, edgecolor='black')
plt.title('Histograma de Alturas de Plantas')
plt.xlabel('Altura (cm)')
plt.ylabel('Frecuencia')
plt.show()
Resultados Esperados
Al ejecutar cada uno de estos bloques de código, obtendrás las medidas descriptivas y un histograma para cada conjunto de datos. Los resultados incluirán la media, mediana, moda, rango, varianza, desviación estándar y la tabla de frecuencias, así como un gráfico que representa la distribución de los datos.
Estos ejercicios ofrecen una práctica completa sobre cómo manejar diferentes conjuntos de datos y calcular medidas descriptivas utilizando Python. Puedes modificar los datos para explorar diferentes escenarios y mejorar tus habilidades en el análisis de datos.