Explorando la Regresión Lineal con Python

 Introducción.-

En esta entrada de blog, nos sumergiremos en el mundo de la estadística matemática aplicada, utilizando Python para realizar un análisis de regresión lineal. La regresión lineal es una técnica fundamental en estadística que se utiliza para modelar la relación entre una variable dependiente y una o más variables independientes.

Código Python.-

Aca se presenta un ejemplo de código que lleva a cabo un análisis de regresión lineal simple:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score

# Generando datos simulados
np.random.seed(0)
X = 2.5 * np.random.randn(1000) + 1.5   # 1000 valores de X
res = 0.5 * np.random.randn(1000)       # 1000 residuos
y = 2 + 0.3 * X + res                   # y = 2 + 0.3X + ruido

# Convertir X y y en un DataFrame
df = pd.DataFrame({'X': X, 'y': y})

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(df['X'], df['y'], test_size=0.2, random_state=0)

# Reshape los datos
X_train = X_train.values.reshape(-1,1)
X_test = X_test.values.reshape(-1,1)

# Crear el modelo de regresión lineal y ajustarlo a los datos de entrenamiento
model = LinearRegression()
model.fit(X_train, y_train)

# Predicciones
y_pred = model.predict(X_test)

# Visualización
plt.scatter(X_test, y_test, color='black')
plt.plot(X_test, y_pred, color='blue', linewidth=3)
plt.xlabel('X')
plt.ylabel('y')
plt.title('Regresión Lineal Simple')
plt.show()

# Métricas de rendimiento
print('Error Cuadrático Medio (MSE):', mean_squared_error(y_test, y_pred))
print('Coeficiente de Determinación (R^2):', r2_score(y_test, y_pred))
Error Cuadrático Medio (MSE): 0.2449976720185338 Coeficiente de Determinación (R^2): 0.6431363258411124


Explicación del Código

El script realiza, genera un conjunto de datos simulados con una relación lineal conocida.

Divide los datos en un conjunto de entrenamiento y otro de prueba.

Utiliza la biblioteca sklearn para crear y entrenar un modelo de regresión lineal.

Realiza predicciones en el conjunto de prueba y las visualiza en un gráfico.

Calcula y muestra métricas de rendimiento como el Error Cuadrático Medio (MSE) y el Coeficiente de Determinación (R^2).

Conclusión.-

Este ejemplo ilustra cómo Python puede ser una herramienta poderosa y accesible para realizar análisis estadísticos complejos, como la regresión lineal. La capacidad de visualizar los resultados y calcular métricas clave nos permite evaluar la efectividad de nuestro modelo y comprender mejor la relación entre variables.


Comentarios

Entradas populares de este blog

Utilizando Gráficas Multivariantes con Python