Introducción a la probabilidad en Python en el área de Estadística

Introduccion.-

En el área de Estadística, la programación es fundamental, en el caso del concepto de probabilidad es fundamental en el área de estadística y las matemáticas y se ocupa de cuantificar la incertidumbre. La probabilidad ofrece un marco para analizar y predecir la ocurrencia de eventos en condiciones de incertidumbre. Denotamos un resumen de los conceptos clave en  introducción a la probabilidad:


Definición de Probabilidad: La probabilidad mide la posibilidad de que ocurra un evento específico. Se expresa numéricamente entre 0 y 1, donde 0 indica imposibilidad y 1 indica certeza absoluta.

Experimentos, Espacios Muestrales y Eventos:

Experimento: Un proceso que produce un resultado observable.

Espacio Muestral: El conjunto de todos los resultados posibles de un experimento.

Evento: Un conjunto de resultados de un espacio muestral.

Probabilidad de Eventos:

Eventos Mutuamente Exclusivos: Dos eventos que no pueden ocurrir al mismo tiempo.

Eventos Independientes: La ocurrencia de un evento no afecta la probabilidad de ocurrencia del otro.

Reglas de Probabilidad:

Regla de la Suma: Para eventos mutuamente excluyentes, la probabilidad de que ocurra uno o el otro es la suma de sus probabilidades individuales.

Regla del Producto: Para eventos independientes, la probabilidad de que ambos ocurran es el producto de sus probabilidades individuales.

Probabilidad Condicional: La probabilidad de que ocurra un evento dado que otro evento ya ha ocurrido.

Teorema de Bayes: Un principio importante que relaciona la probabilidad condicional y la probabilidad marginal, permitiendo actualizar las probabilidades a medida que se obtiene nueva información.

Distribuciones de Probabilidad: Describen cómo se distribuyen las probabilidades a través de los diferentes resultados de un experimento. Las distribuciones pueden ser discretas (como la distribución binomial) o continuas (como la distribución normal).

Esperanza y Varianza:

Esperanza (Valor Esperado): El promedio ponderado de todos los posibles resultados de un experimento.

Varianza: Mide la dispersión de los valores en relación con la expectativa.

Estos conceptos forman la base del estudio de la probabilidad, proporcionando las herramientas necesarias para analizar situaciones aleatorias y hacer predicciones informadas en una amplia gama de campos, desde la ciencia y la ingeniería hasta la economía y la toma de decisiones.

Por ejemplo se tiene el siguiente problema:

Supongamos que se quiere calcular la probabilidad de obtener un "6" al lanzar un dado  no cargado de seis caras. La probabilidad teórica es 1/6, ya que hay seis resultados posibles y solo uno de ellos es un "6". Vamos a simular este proceso usando Python para ver cómo se acerca la simulación a la probabilidad teórica.

$$ \mathbb{P}(X=x) = \begin{cases} \dfrac{1}{6}, & x= 1,2,3,4,5,6\\ 0, & e.o.c. \\ \end{cases} $$

El código en python es:

import random

def lanzar_dado():
    return random.randint(1, 6)

def simulacion_lanzamiento_dado(numero_de_lanzamientos):
    conteo_de_seis = 0
    for _ in range(numero_de_lanzamientos):
        resultado = lanzar_dado()
        if resultado == 6:
            conteo_de_seis += 1
    return conteo_de_seis / numero_de_lanzamientos

 
Se importa el modulo random, para luego construir dos funciones, la primera toma valores pseudo aleatorios y la segunda simula el lanzamiento del dado.

# Simulación con 1000 lanzamientos
probabilidad = simulacion_lanzamiento_dado(1000)
print(f"Probabilidad de obtener un 6 en 1000 lanzamientos: {probabilidad}")

Realizando la prueba se obtiene el siguiente resultado:

Probabilidad de obtener un 6 en 1000 lanzamientos: 0.173

Como se puede observar el resultado es 0.173 en 1000 lanzamientos aleatorios, se podria
decir que en mil ensayos la probabilidad que salga un seis es decir un exito tiene
la distribución Distribución Binomial que tiene dos parametros $n$ y $p$.

Esta distribución es apropiada cuando se esta interesado en el número de éxitos en
una serie de ensayos independientes y con la misma probabilidad de éxito.
En este contexto, un "éxito" sería obtener un 6 y:
$n = 1000$, que es el número total de lanzamientos. $p = 1/6$, que es la probabilidad de obtener un 6 en un lanzamiento.

Aca se tiene su grafica de distribución con codigo python:

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom

# Parámetros de la distribución binomial
n = 1000  # número de ensayos
p = 1/6   # probabilidad de éxito (obtener un 6)

# Crear un rango de posibles números de éxitos
k = np.arange(0, 1001)

# Calcular la PMF (Probability Mass Function) para cada valor de k
pmf = binom.pmf(k, n, p)

# Graficar la PMF
plt.figure(figsize=(12, 6))
plt.plot(k, pmf, 'bo', markersize=5)
plt.vlines(k, 0, pmf, colors='b', lw=2)
plt.title('Distribución Binomial de 1000 Lanzamientos de un Dado')
plt.xlabel('Número de Seises')
plt.ylabel('Probabilidad')
plt.grid(True)
plt.show()



Cuya Esperanza matemática y varianza es:

$$\mathbb{E}(X)= 166.67, \ \ \ \mathbb{V}(X)= 11.79$$


Conclusión.-

Con la inclusión del código en python de realizar este experimento probabilístico,
se da como paso interesante de como una variable aleatoria de tipo bernoulli pasa a
distribución binomial, através de los ensayos o lanzamientos, con un ejemplo sencillo
del lanzamiento de un dado, en el que estamos interesados en la cara 6 del dado
no cargado.




Comentarios

Entradas populares de este blog

Utilizando Gráficas Multivariantes con Python