Distribución hipergeométrica (definición, fórmula) - ¿Como calcular?

Definición de distribución hipergeométrica

En las estadísticas y la teoría de la probabilidad, la distribución hipergeométrica es básicamente una distribución de probabilidad distinta que define la probabilidad de k éxitos (es decir, algunos sorteos aleatorios para el objeto dibujado que tiene alguna característica específica) en n números de sorteos, sin ningún reemplazo, de un determinado tamaño de población N que incluye exactamente K objetos que tienen esa característica, donde el sorteo puede tener éxito o puede fallar.

La fórmula para la probabilidad de una distribución hipergeométrica se deriva utilizando varios elementos de la población, número de elementos de la muestra, número de éxitos en la población, número de éxitos en la muestra y pocas combinaciones. Matemáticamente, la probabilidad se representa como,

P = K C k * (N - K) C (n - k) / N C n

dónde,

  • N = No. de ítems en la población
  • n = No de elementos de la muestra
  • K = No. de éxitos en la población
  • k = No. de aciertos en la muestra

La desviación media y estándar de una distribución hipergeométrica se expresa como,

Media = n * K / N Desviación estándar = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Explicación

Paso 1: En primer lugar, determine el número total de elementos de la población, que se indica con N. Por ejemplo, el número de naipes en una baraja es 52.

Paso 2: A continuación, determine el número de elementos de la muestra, indicado por n, por ejemplo, el número de cartas extraídas del mazo.

Paso 3: A continuación, determine las instancias que se considerarán éxitos en la población, y se indicará con K. Por ejemplo, el número de corazones en el mazo general, que es 13.

Paso 4: A continuación, determine las instancias que se considerarán exitosas en la muestra extraída, y se denota con k. Por ejemplo, el número de corazones en las cartas extraídas de la baraja.

Paso 5: Finalmente, la fórmula para la probabilidad de una distribución hipergeométrica se deriva utilizando un número de elementos en la población (paso 1), número de elementos en la muestra (paso 2), número de éxitos en la población (paso 3) y número de éxitos en la muestra (paso 4) como se muestra a continuación.

P = K C k * (N - K) C (n - k) / N C n

Ejemplos de distribución hipergeométrica (con plantilla de Excel)

Ejemplo 1

Tomemos el ejemplo de una baraja ordinaria de naipes en la que se extraen 6 cartas al azar sin reemplazo. Determine la probabilidad de sacar exactamente 4 cartas de suites rojas, es decir, diamantes o corazones.

  • Dado, N = 52 (ya que hay 52 cartas en un mazo de juego normal)
  • n = 6 (Número de cartas extraídas al azar del mazo)
  • K = 26 (ya que hay 13 tarjetas rojas cada una en la suite de diamantes y corazones)
  • k = 4 (Número de tarjetas rojas que se considerarán exitosas en la muestra extraída)

Solución:

Por lo tanto, la probabilidad de sacar exactamente 4 cartas de suites rojas en las 6 cartas extraídas se puede calcular utilizando la fórmula anterior como,

Probabilidad = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C 4 * 26 C 2 / 52 C 6

= 14950 * 325/20358520

La probabilidad será -

Probabilidad = 0.2387 ~ 23.87%

Por lo tanto, hay una probabilidad del 23,87% de sacar exactamente 4 cartas rojas mientras se extraen 6 cartas al azar de una baraja normal.

Ejemplo # 2

Tomemos otro ejemplo de una billetera que contiene 5 billetes de $ 100 y 7 billetes de $ 1. Si se eligen 4 billetes al azar, determine la probabilidad de elegir exactamente 3 billetes de $ 100.

  • Dado, N = 12 (Número de billetes de $ 100 + Número de billetes de $ 1)
  • n = 4 (Número de billetes elegidos al azar)
  • K = 5 (ya que hay 5 billetes de $ 100)
  • k = 3 (Número de billetes de $ 100 que se considerarán un éxito en la muestra elegida)

Solución:

Por lo tanto, la probabilidad de elegir exactamente 3 billetes de $ 100 en los 4 billetes elegidos al azar se puede calcular utilizando la fórmula anterior como,

Probabilidad = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C 1 / 12 C 4

= 10 * 7/495

La probabilidad será -

Probabilidad = 0,1414 ~ 14,14%

Por lo tanto, existe una probabilidad del 14,14% de elegir exactamente 3 billetes de $ 100 mientras se extraen 4 billetes al azar.

Relevancia y usos

El concepto de distribución hipergeométrica es importante porque proporciona una forma precisa de determinar las probabilidades cuando el número de ensayos no es muy grande y las muestras se toman de una población finita sin reemplazo. De hecho, la distribución hipergeométrica es análoga a la distribución binomial, que se utiliza cuando el número de ensayos es sustancialmente grande. Sin embargo, la distribución hipergeométrica se utiliza predominantemente para el muestreo sin reemplazo.

Articulos interesantes...