Distribución normal en estadística: definición, ejemplo, interpretación

¿Qué es la distribución normal en estadística?

La distribución normal es una curva de distribución de frecuencia en forma de campana que ayuda a describir todos los valores posibles que una variable aleatoria puede tomar dentro de un rango dado, con la mayor parte del área de distribución en el medio y pocas en las colas, en los extremos. Esta distribución tiene dos parámetros clave: la media (µ) y la desviación estándar (σ) que juega un papel clave en el cálculo de la rentabilidad de los activos y en la estrategia de gestión de riesgos.

Cómo interpretar la distribución normal

La figura anterior muestra que la distribución estadística normal es una curva en forma de campana. El rango de posibles resultados de esta distribución son los números reales enteros que se encuentran entre -∞ y + ∞. Las colas de la curva de campana se extienden a ambos lados del gráfico (+/-) sin límites.

  • Aproximadamente el 68% de todas las observaciones caen dentro de +/- una desviación estándar (σ)
  • Aproximadamente el 95% de todas las observaciones se encuentran dentro de +/- dos desviaciones estándar (σ)
  • Aproximadamente el 99% de todas las observaciones se encuentran dentro de +/- tres desviaciones estándar (σ)

Tiene una asimetría de cero (simetría de una distribución). Si la distribución de datos es asimétrica, entonces la distribución es desigual si el conjunto de datos tiene un sesgo mayor que cero o un sesgo positivo. Entonces, la cola derecha de la distribución es más prolongada que la izquierda, y para un sesgo negativo (menos de cero) la cola izquierda será más larga que la cola derecha.

Tiene una curtosis de 3 (mide el pico de una distribución), lo que indica que la distribución no es ni demasiado puntiaguda ni demasiado fina. Si la curtosis es mayor que tres, la distribución es más puntiaguda con colas más gruesas, y si la curtosis es menor que tres, entonces tiene colas delgadas y el punto máximo es más bajo que la distribución normal.

Caracteristicas

  • Representan una familia de distribución donde la media y la desviación determinan la forma de la distribución.
  • La media, la mediana y la moda de esta distribución son todas iguales.
  • La mitad de los valores están a la izquierda del centro y la otra mitad a la derecha.
  • El valor total bajo la curva estándar siempre será uno.
  • Lo más probable es que la distribución esté en el centro y que haya menos valores al final.

Transformación (Z)

La función de densidad de probabilidad (PDF) de una variable aleatoria (X) que sigue la distribución viene dada por:

donde -∞ <x <∞; -∞ <µ 0

Dónde,

  • F (x) = Función de probabilidad normal
  • x = variable aleatoria
  • µ = Media de distribución
  • σ = Desviación estándar de la distribución
  • π = 3,14159
  • e = 2,71828

Fórmula de transformación

Dónde,

  • X = variable aleatoria

Ejemplos de distribución normal en estadística

Analicemos los siguientes ejemplos.

Ejemplo 1

Suponga que una empresa tiene 10000 empleados y una estructura de salarios múltiples según el puesto de trabajo en el que trabaja el empleado. Los salarios se distribuyen generalmente con la media poblacional de µ = $ 60 000 y la desviación estándar de la población σ = $ 15 000. ¿Cuál será la probabilidad de que un empleado seleccionado al azar tenga un salario de menos de $ 45000 al año?

Solución

Como se muestra en la figura anterior, para responder a esta pregunta, necesitamos averiguar el área bajo la curva normal desde 45 hasta la cola del lado izquierdo. Además, necesitamos usar el valor de la tabla Z para obtener la respuesta correcta.

En primer lugar, necesitamos convertir la media y la desviación estándar dadas en una distribución normal estándar con media (µ) = 0 y desviación estándar (σ) = 1 utilizando la fórmula de transformación.

Después de la conversión, debemos buscar la tabla Z para encontrar el valor correspondiente, que nos dará la respuesta correcta.

Dado,

  • Media (µ) = $ 60 000
  • Desviación estándar (σ) = $ 15000
  • Variable aleatoria (x) = $ 45000

Transformación (z) = (45000 - 60000/15000)

Transformación (z) = -1

Ahora el valor que es equivalente a -1 en la tabla Z es 0.1587, que representa el área bajo la curva desde 45 hacia la izquierda. Indicó que cuando seleccionamos al azar a un empleado, la probabilidad de ganar menos de $ 45000 al año es del 15,87%.

Ejemplo # 2

Ahora, manteniendo el mismo escenario anterior, averigüe la probabilidad de que un empleado seleccionado al azar gane más de $ 80,000 al año usando la distribución normal.

Solución

Entonces, en esta pregunta, necesitamos averiguar el área sombreada desde 80 hasta la cola derecha usando la misma fórmula.

Dado,

  • Media (µ) = $ 60 000
  • Desviación estándar (σ) = $ 15000
  • Variable aleatoria (X) = $ 80,000

Transformación (z) = (80000-60000 / 15000)

Transformación (z) = 1,33

Según la tabla Z, el valor equivalente de 1,33 es 0,9082 o 90,82%, lo que muestra que la probabilidad de seleccionar al azar a los empleados que ganan menos de $ 80 000 anuales es del 90,82%.

Pero según la pregunta, debemos determinar la probabilidad de que los empleados aleatorios ganen más de $ 80,000 al año, por lo que debemos restar el valor de 100.

  • Variable aleatoria (X) = 100% - 90,82%
  • Variable aleatoria (X) = 9.18%

Entonces, la probabilidad de que los empleados ganen más de $ 80,000 por año es 9.18%.

Usos

  • El gráfico técnico del mercado de valores es a menudo una curva de campana, lo que permite a los analistas e inversores hacer inferencias estadísticas sobre el rendimiento esperado y el riesgo de las acciones.
  • Se utiliza en el mundo real, como para determinar el mejor tiempo más probable que las empresas de pizzerías tarden en entregar pizza y muchas más aplicaciones reales.
  • Se utiliza para comparar alturas de un conjunto de población determinado en el que la mayoría de las personas tendrán un tamaño medio y muy pocas personas tendrán una estatura superior o inferior a la media.
  • Se utilizan para determinar el rendimiento académico promedio de los estudiantes, lo que ayuda a comparar el rango de los estudiantes.

Conclusión

La distribución normal encuentra aplicaciones en ciencia de datos y análisis de datos. Las tecnologías avanzadas como la inteligencia artificial y el aprendizaje automático que se utilizan junto con esta distribución pueden brindar una mejor calidad de los datos, lo que ayudará a las personas y a las empresas a tomar decisiones de manera efectiva.

Articulos interesantes...