Fórmula de correlación - ¿Como calcular? (Paso a paso)

Fórmula para calcular la correlación

La correlación es una medida estadística entre dos variables y se define como el cambio de cantidad en una variable correspondiente al cambio en otra y se calcula sumando el producto de la suma de la primera variable menos la media de la primera variable en la suma de la segunda variable menos la media de la segunda variable dividida por el todo bajo la raíz del producto del cuadrado de la primera variable menos la media de la primera variable en la suma del cuadrado de la segunda variable menos la media de la segunda variable.

El valor de correlación está limitado entre -1 y +1 y se puede interpretar de la siguiente manera:

  • -1: si es -1, entonces las variables se conocen como perfectamente correlacionadas negativamente. Eso significa que si una variable se mueve en una dirección, otra se mueve en la dirección opuesta.
  • 0: Eso significa que la variable no tiene ninguna correlación.
  • +1: si es +1, entonces las variables se conocen como perfectamente correlacionadas positivamente. Ambas variables se mueven en direcciones positivas.

Si tenemos 2 variables xey, entonces el coeficiente de correlación entre 2 variables se puede encontrar como:

Coeficiente de correlación = ∑ (x (i) - media (x)) * (y (i) -mean (y)) / √ (∑ (x (i) -mean (x)) 2 * ∑ (y (i) -medio (y)) 2 )

Dónde,

  • x (i) = valor de x en la muestra
  • Media (x) = media de todos los valores de x
  • y (i) = valor de y en la muestra
  • Media (y) = media de todos los valores de y

Ejemplos

Es fácil calcular la correlación en Excel. La sintaxis de la función utilizada es la siguiente:

Coeficiente de correlación = CORREL (matriz1, matriz2)

Ejemplo 1

Tomemos el mismo ejemplo que hemos tomado anteriormente para calcular la correlación usando Excel.

Solución:

A continuación se muestran los valores de xey:

El cálculo es el siguiente.

Fórmula básica de Excel = CORREL (matriz (x), matriz (y))

Coeficiente = +0,95

Dado que este coeficiente está cerca de +1, xey están correlacionados de manera muy positiva.

Ejemplo # 2

La correlación es principalmente útil para analizar el precio de las acciones de las empresas y crear una cartera de acciones basada en eso.

Averigüemos la correlación de las acciones de Apple con el índice Nasdaq en función del rendimiento de las acciones del último año. Apple es una empresa multinacional con sede en EE. UU. Especializada en productos de TI como iPod, iPad, Mac, etc.

Solución:

A continuación se muestra el rendimiento mensual de las acciones de Apple y Nasdaq durante el último año:

Ingresemos ahora los valores -

Coeficiente de correlación = ∑ (x (i) - media (x)). (Y (i) -mean (y)) / √ ∑ (x (i) -mean (x)) 2 ∑ (y (i) - media (y)) 2

Correlación entre Apple y Nasdaq = 0.039 / (√0.0039)

Coeficiente = 0,62

Dado que la correlación entre Apple y Nasdaq es positiva, Apple está correlacionada positivamente con Nasdaq.

Ejemplo # 3

Veamos ahora la correlación entre Walmart y el índice Nasdaq según el desempeño de las acciones del último año. Walmart es una empresa con sede en EE. UU. Que tiene una cadena de supermercados minoristas.

Solución:

A continuación se muestra el desempeño mensual entre Walmart y Nasdaq durante el último año-

Ingresemos ahora los valores en la fórmula:

Coeficiente de correlación = ∑ (x (i) - media (x)). (Y (i) -mean (y)) / √ ∑ (x (i) -mean (x)) 2 ∑ (y (i) - media (y)) 2

Por tanto, el cálculo es el siguiente,

Correlación entre Walmart y Nasdaq = 0.0032 / (√0.0346 * 0.0219)

Coeficiente = 0.12

Podemos ver que Walmart y Nasdaq también están correlacionados positivamente, pero no tanto en comparación con la correlación de Apple con Nasdaq.

Relevancia y uso

Un coeficiente de correlación es útil para establecer la relación lineal entre dos variables. Mide cómo se moverá una variable en comparación con el movimiento de otra variable. El uso práctico de este coeficiente es averiguar la relación entre el movimiento del precio de las acciones y el movimiento general del mercado. La base de este análisis, un analista de acciones, incluirá la proporción de acciones para crear una cartera óptima con un riesgo mínimo. Además, es útil en ciencia de datos averiguar la relación entre 2 variables.

Además, el coeficiente de correlación se utiliza mucho para estudiar la validez de constructo de los datos en el análisis factorial. Se utiliza mucho en el análisis de regresión para predecir los valores de las variables dependientes según la relación entre las variables dependientes e independientes. Esta ecuación es bastante útil en el análisis cuantitativo para obtener la naturaleza de la relación entre varias variables. La base de esta relación, si una variable no está relacionada con otras variables, entonces se puede eliminar de la lista.

Articulos interesantes...