Entradas

Mostrando entradas de noviembre, 2023

Explorando la Regresión Lineal con Python

Imagen
 Introducción.- En esta entrada de blog, nos sumergiremos en el mundo de la estadística matemática aplicada, utilizando Python para realizar un análisis de regresión lineal. La regresión lineal es una técnica fundamental en estadística que se utiliza para modelar la relación entre una variable dependiente y una o más variables independientes. Código Python.- Aca se presenta un ejemplo de código que lleva a cabo un análisis de regresión lineal simple: import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error, r2_score # Generando datos simulados np.random.seed( 0 ) X = 2.5 * np.random.randn( 1000 ) + 1.5   # 1000 valores de X res = 0.5 * np.random.randn( 1000 )       # 1000 residuos y = 2 + 0.3 * X + res                   # y = 2 + 0.3X + rui...

Ejemplo de Análisis Estadístico con Python

Imagen
Introducción.-  En esta entrada, exploraremos cómo realizar un análisis estadístico básico utilizando Python. Este ejemplo es perfecto para aquellos que están empezando en el campo de la estadística y desean aprender cómo aplicar técnicas estadísticas usando Python. Código Python.- A continuación, se presenta un ejemplo de código Python que realiza un análisis estadístico básico import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from scipy import stats # Generando datos de muestra data = np.random.normal( 0 , 1 , 1000 ) # Creando un DataFrame de Pandas df = pd.DataFrame(data, columns=[ 'Sample Data' ]) # Resumen estadístico print (df.describe()) # Gráfico de distribución sns.histplot(df[ 'Sample Data' ], kde= True ) plt.title( 'Distribución de los Datos' ) plt.xlabel( 'Valor' ) plt.ylabel( 'Frecuencia' ) plt.show() # Prueba de normalidad stat, p = stats.shapiro(data) print ( 'Estadístico de ...

Suavizado de Splines - Serie de Tiempo

Imagen
El método de suavizamiento spline es una técnica estadística utilizada para suavizar datos o construir una función que se ajuste a los datos observados. Un spline es una función matemática que se utiliza para interpolar entre puntos de datos, creando una curva suave. Esta técnica es especialmente útil en situaciones donde se requiere un ajuste suave que pueda capturar patrones complejos en los datos, como en modelado de curvas y análisis de series temporales. Splines: Son funciones polinómicas definidas por tramos. Cada tramo del spline es un polinomio, y estos polinomios están conectados en puntos específicos llamados nodos o puntos de control. Continuidad y Suavidad: Los splines son diseñados para ser continuos y tener derivadas continuas en los puntos de control, asegurando una transición suave entre los segmentos polinómicos. Tipos de Splines: Splines Lineales: Conectan los puntos de datos con segmentos de línea recta. Splines Cuadráticos: Utilizan polinomios de segundo grado p...

Suavizado Exponencial (Exponential Smoothing) - Series de tiempo

Imagen
Esta técnica de suavizacion se basa en la atenuación de los valores de la serie de tiempo, obteniendose el valor de estos de manera exponenecial; es decir, los datos se ponderan, dandole un mayor peso a las observaciones recientes y menor peso a las mas antiguas. Al más reciente se le otorga el valor de $\alpha$, a la observación inmediata anterior se le otorga $\alpha(1-\alpha)$, a la siguiente observacion inmediata anterior se le da el peso de ponderación  de $\alpha(1-\alpha)^2$  y asi sucesivamente hasta completar el número de valores observados en la serie de tiempo, todo este proceso nos conlleva a la siguiente expresión  para realizar el cálculo de la Suavización Exponencial Simple (SES). $$ \begin{aligned} P_{t+1} & =\alpha \cdot Y_t + \alpha\cdot (1-\alpha)\cdot T_{t-1} + \alpha\cdot (1-\alpha)^2\cdot Y_{t-2} + \ldots  \\ P_{t+1} & = \alpha\cdot Y_t + (1-\alpha)\cdot P_t \end{aligned}$$. Donde: $Y_t$: Es el valor de la serie en el periodo $t$. $P_{t+...

Métodos de Suavizamiento Promedio movil - Series de Tiempo

Imagen
La teoría de los métodos de suavizamiento se refiere a un conjunto de técnicas estadísticas utilizadas para reducir la variabilidad o "ruido" en los datos, con el objetivo de resaltar patrones o tendencias importantes. Estos métodos son ampliamente utilizados en análisis de series temporales, procesamiento de señales, y en varios campos de la ciencia de datos. Algunos de los métodos de suavizamiento más comunes incluyen: Promedio Móvil (Moving Average): Calcula el promedio de un número específico de valores consecutivos a lo largo de la serie de tiempo. Esto suaviza las fluctuaciones a corto plazo y resalta las tendencias a largo plazo. Suavizado Exponencial (Exponential Smoothing): Asigna pesos decrecientes a los datos más antiguos. Hay varias variantes de este método, como el suavizado exponencial simple, doble y triple, cada uno añadiendo más complejidad para capturar tendencias y patrones estacionales. Filtros de Suavizamiento: Como los filtros de media móvil y los fil...

Utilizando Gráficas Multivariantes con Python

Imagen
 Introducción.-  La teoría detrás de las gráficas de caja o "boxplots" se basa en proporcionar una representación visual de la distribución estadística de un conjunto de datos. Aquí te explico los componentes clave y cómo se construyen: Cuartiles: Las gráficas de caja utilizan cuartiles para dividir los datos. El conjunto de datos se divide en cuatro partes iguales: Q1 (Cuartil inferior): Representa el 25% de los datos. Q2 (Mediana o segundo cuartil): El punto medio de los datos. Q3 (Cuartil superior): Representa el 75% de los datos. Caja: La caja en sí misma muestra el rango intercuartílico (RIC), que es la distancia entre el primer y el tercer cuartil (Q3 - Q1). Dentro de la caja, se marca la mediana (Q2). Bigotes (Whiskers): Se extienden desde la caja hasta los valores más altos y más bajos dentro de un rango determinado. Este rango suele ser 1.5 veces el RIC por encima de Q3 y por debajo de Q1. Los datos fuera de este rango se consideran valores atípicos. Valores Atípico...

Introducción a la probabilidad en Python en el área de Estadística

Imagen
Introduccion.- En el área de Estadística, la programación es fundamental, en el caso del concepto de probabilidad es fundamental en el área de estadística y las matemáticas y se ocupa de cuantificar la incertidumbre. La probabilidad ofrece un marco para analizar y predecir la ocurrencia de eventos en condiciones de incertidumbre. Denotamos un resumen de los conceptos clave en  introducción a la probabilidad: Definición de Probabilidad: La probabilidad mide la posibilidad de que ocurra un evento específico. Se expresa numéricamente entre 0 y 1, donde 0 indica imposibilidad y 1 indica certeza absoluta. Experimentos, Espacios Muestrales y Eventos : Experimento : Un proceso que produce un resultado observable. Espacio Muestral : El conjunto de todos los resultados posibles de un experimento. Evento : Un conjunto de resultados de un espacio muestral. Probabilidad de Eventos: Eventos Mutuamente Exclusivos: Dos eventos que no pueden ocurrir al mismo tiempo. Eventos Independientes: La ...