Cálculo con datos reales
Aquí tienes un ejemplo con datos reales
from sklearn.metrics import mean_squared_error,mean_absolute_error,r2_score import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.metrics import mean_squared_error from sklearn.datasets import fetch_california_housing # Cargar el conjunto de datos "California Housing" california = fetch_california_housing() print(california) # Crear un DataFrame con los datos df = pd.DataFrame(california.data, columns=california.feature_names) # Añadir la columna de los precios de las casas df['PRICE'] = california.target # Mostrar las primeras filas del DataFrame print(df.head()) # Dividir los datos en variables predictoras (X) y la variable objetivo (y) X = df.drop(columns=['PRICE']) y = df['PRICE'] # Dividir el conjunto de datos en entrenamiento y prueba (80% - 20%) X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # Crear el modelo de regresión lineal modelo = LinearRegression() # Entrenar el modelo con los datos de entrenamiento modelo.fit(X_train, y_train) # Predecir los precios con los datos de prueba y_pred = modelo.predict(X_test) # Calcular métricas mse = mean_squared_error(y_test, y_pred) rmse = np.sqrt(mse) mae = mean_absolute_error(y_test, y_pred) r2 = r2_score(y_test, y_pred) # Imprimir resultados print(f"Error Cuadrático Medio (MSE): {mse:.2f}") print(f"Raíz del Error Cuadrático Medio (RMSE): {rmse:.2f}") print(f"Error Absoluto Medio (MAE): {mae:.2f}") print(f"Coeficiente de Determinación (R²): {r2:.2f}")