Fórmula del coeficiente de correlación de Pearson | Ejemplo | Cálculo
¿Qué es el coeficiente de correlación?
Definición: El coeficiente de correlación, también conocido comúnmente como correlación de Pearson, es una medida estadística de la dependencia o asociación de dos números. Cuando dos conjuntos de números se mueven en la misma dirección al mismo tiempo, se dice que tienen una correlación positiva. Cuando una serie de números sube mientras la otra desciende, se dice que tienen una correlación negativa. Esto resultará en un coeficiente de correlación negativo.
El coeficiente de correlación se aplica a las finanzas y la economía para rastrear y comprender mejor los datos. Si bien las pequeñas empresas a menudo no siguen las tendencias de los datos y el análisis estadístico; Los bancos de inversión, las empresas de servicios financieros e incluso la reserva federal de los Estados Unidos utilizan el coeficiente de correlación para ayudar a rastrear los datos históricos con la esperanza de que puedan ayudar a predecir y determinar mejor las tendencias del mercado.
A raíz de la crisis financiera de 2008, la Reserva Federal redujo las tasas de interés en un esfuerzo por estimular la economía. Esta bajada de tasas también redujo la tasa de desempleo. Esto muestra que la tasa de interés de la Fed y la tasa de desempleo de EE. UU. Tienen un coeficiente de correlación positivo.
Echemos un vistazo a cómo calcular el coeficiente de correlación.
Fórmula
La fórmula del coeficiente de correlación es más larga de lo que la mayoría de los profesionales quieren calcular, por lo que normalmente utilizan fuentes de datos que ya dan el resultado, o una calculadora matemática que puede entregar rápidamente el resultado de la correlación cuando se dan los datos. Esto también se puede programar en una hoja de cálculo de Excel.
Una vez que el coeficiente de correlación es un número de -1 a 1, o cualquier número intermedio. Si dos conjuntos de datos se mueven en un paso de bloqueo en la misma dirección y en la misma cantidad, tienen un coeficiente de correlación de 1. Si se mueven exactamente en la misma cantidad pero en la dirección opuesta, el número sería -1.
Si los dos conjuntos de datos parecen no tener ninguna relación, tienen una correlación de 0. En el ejemplo anterior, donde la Reserva Federal bajó las tasas de interés y la tasa de desempleo también bajó algo. Los dos números tenían una correlación positiva (coeficiente de correlación mayor que 0). Pero debido a que no se movieron la misma cantidad, el número sería menor que 1.
Echemos un vistazo a un ejemplo.
Ejemplo
Yvonne es una buena estudiante, pero a veces no duerme lo suficiente. Ella plantea la hipótesis de que cuando duerme más le va mejor en los exámenes. Para probar su hipótesis, hizo un seguimiento de su desempeño en una serie de pruebas, basándose en cuántas horas de sueño había dormido la noche anterior. Ingresa los siguientes datos en su archivo de Excel para calcular la ecuación del coeficiente de correlación.
Ella usa la fórmula de correlación “(CORRELL) dentro de Excel e ingresa sus conjuntos de datos como se ve a continuación. 0,65 es la salida de fórmulas. ¡Bastante seguro! Yvonne tenía razón, sus horas de sueño se obtuvieron la noche anterior a un examen y los puntajes de sus exámenes están correlacionados positivamente.
El resultado de 0,65 significa que cuando aumenta el número de horas de sueño, también lo hace la puntuación de la prueba. Si los dos números hubieran estado perfectamente correlacionados (ambos aumentaron en el mismo porcentaje), entonces el coeficiente de correlación habría sido exactamente 1.
Supongamos que Yvonne planteó su pregunta de otra manera. Si pensara: «Apuesto a que me perderé menos preguntas en mis exámenes si solo pudiera dormir más». Y luego rastreara el número de preguntas perdidas (un número decreciente) en lugar de la puntuación de la prueba (un número creciente) seguramente encontraría que el aumento en las horas dormidas antes de la prueba equivale a menos preguntas perdidas y, por lo tanto, los dos conjuntos de datos serían tienen una correlación NEGATIVA.
Si su objetivo fuera tener un aumento o una disminución directa en un resultado, sería deseable un coeficiente de correlación más cercano a -1 o 1. Cuanto más cerca de 0 esté el coeficiente de correlación, más débiles serán los resultados. Por ejemplo, si Yvonne quisiera ver cómo el número de horas dormidas afectaba su estatura cuando se despertara a la mañana siguiente, seguramente encontraría que no hay correlación, y el coeficiente de correlación sería 0.
Si el propietario de una pequeña empresa registrara y mantuviera excelentes datos sobre su negocio de la forma en que Yvonne lo hizo sobre sus hábitos de sueño, podría calcular y rastrear la causa y efecto o el coeficiente de correlación de muchos aspectos de su negocio.
Si el propietario de un restaurante hubiera sido objeto de escrutinio por problemas de salud y seguridad, podría rastrear los resultados de limpiezas de cocina más frecuentes mediante el seguimiento del número de limpiezas y el número de informes de intoxicación alimentaria. Idealmente, vería una disminución en el número de casos de intoxicación alimentaria a medida que aumenta el número de limpiezas de cocina. Si este fuera el caso, sería un ejemplo de libro de texto de un coeficiente de correlación negativo. Cuando un conjunto de datos aumentó, el otro disminuyó.
Análisis e interpretación
El coeficiente de correlación se utiliza con mayor frecuencia en el análisis de empresas públicas o clases de activos. Si un analista de banca de inversión investigara inversiones que aumentan de valor con el tiempo (se aprecian) pero también quisiera encontrar una inversión que no tuviese una correlación fuerte con el mercado de valores, el coeficiente de correlación sería sin duda uno de los criterios que serían tenido en cuenta. De esta forma, el inversor podría diversificar sus inversiones y no tener todos sus huevos en una canasta dependiente del mercado.
La Cartera 1 es el mercado de valores de EE. UU., Que no es de extrañar que se mueva a la perfección consigo mismo, lo que le da un coeficiente de correlación de exactamente 1,00 (imagen inferior derecha).
La cartera 2 es oro, un metal precioso que ha subido de valor al igual que el mercado de valores, pero que no ha subido al mismo tiempo que el mercado, de hecho, las dos clases de activos no parecen tener mucho efecto sobre el otro moviéndose hacia arriba o hacia abajo. Esto da un coeficiente de correlación muy bajo, 0.05 para ser exactos.
La cartera 3 es un bono del gobierno a largo plazo, parecen moverse en la dirección opuesta a la del mercado de valores, pero eso es una generalización y no es cierto todo el tiempo. Como puede ver, su coeficiente de correlación con el mercado es de -0,30.
Explicación de uso práctico: precauciones y limitaciones
El coeficiente de correlación es una poderosa herramienta de análisis, pero también debe usarse con otras métricas y no en el vacío. También es importante tener en cuenta que este análisis es simplemente una herramienta para rastrear el desempeño pasado. Con base en el desempeño pasado, los analistas pueden hacer predicciones, pero no siempre son precisas ya que el mercado cambia de manera impredecible.
Tenga cuidado al tomar decisiones basadas exclusivamente en estos datos. Úselo junto con otra información y datos para comprender mejor toda la industria y el mercado.