R-cuadrado (R2) – Fórmula | Ejemplo | Cálculo
R cuadrado, también conocido como coeficiente de determinación, es la medida estadística de la correlación entre el rendimiento de una inversión y un índice de referencia específico. En otras palabras, muestra en qué grado se puede atribuir el rendimiento de una acción o cartera a un índice de referencia.
Definición – ¿Qué es R-Squared?
Específicamente, esta regresión lineal se usa para determinar qué tan bien se ajusta una línea a un conjunto de datos de observaciones, especialmente cuando se comparan modelos. Además, es la fracción de la variación total en y que captura un modelo. O qué tan bien sigue una línea las variaciones dentro de un conjunto de datos.
Fórmula
La fórmula de R cuadrado se calcula dividiendo la suma de los primeros errores por la suma de los segundos errores y restando la derivación de 1. Así es como se ve la ecuación de r cuadrado.
R-cuadrado = 1 – (Primera suma de errores / Segunda suma de errores)
Tenga en cuenta que este es el último paso para calcular el r-cuadrado para un conjunto de puntos de datos. Hay varios pasos que debe calcular antes de llegar a este punto.
Primero, usa la línea de la ecuación de mejor ajuste para predecir los valores de y en el gráfico en función de los valores de x correspondientes. Una vez que la línea de mejor ajuste está en su lugar, los analistas pueden crear una ecuación de error al cuadrado para mantener los errores dentro de un rango relevante. Una vez que tenga una lista de errores, puede sumarlos y ejecutarlos a través de la fórmula R-cuadrado. Echemos un vistazo a un ejemplo.
Ejemplo
Para ayudar a explicar qué significa exactamente R cuadrado, les contaré acerca de dos tiendas de sándwiches en mi ciudad, Jimmy’s Sandwich Shop y Fozzie’s Sandwich Emporium. En Jimmy John’s cobran $ 5 por un sándwich y $ 1.00 por cada aderezo adicional (es decir, el doble de carne $ 1.00, el doble de queso $ 1.00 o el doble de lechuga por $ 1.00). En Fozzie’s también cobran $ 5,00 por un sándwich, pero diferentes precios de cobertura (es decir, doble carne $ 1,50, doble queso $ 0,75 o doble lechuga $ 0,50).
Ahora, me senté afuera de Jimmy’s durante 7 días y realicé una encuesta de todos los clientes que se iban y les pregunté cuántos ingredientes habían pedido y cuál era el precio total. El primer cliente, Joe, pidió 3 coberturas y el precio fue de $ 8,00. El segundo cliente, Suzie, pidió 4 ingredientes y el precio fue de $ 9,00. El tercer cliente, Pat, ordenó 5 temas y el precio fue de $ 10,00. Terminé recolectando 100 muestras. Al final de la semana, tracé estos puntos en un gráfico y descubrí que podía explicar el precio usando la siguiente ecuación Precio = $ 5 + $ 1.00 (# de ingredientes) y descubrí que r-cuadrado = 100%.
Para comprender lo que nos dice r-cuadrado, debe comprender la palabra variabilidad. Cuando digo variabilidad, debería pensar en la palabra «difiere». Ahora, te voy a explicar lo que significa r cuadrado. Sabemos que los precios de los sándwiches varían o difieren según la cantidad de ingredientes. Lo que R2 nos dice de la tienda Jimmy’s Sandwich es que el 100% de las diferencias en el precio se pueden explicar por el número de ingredientes. O en otras palabras, la única razón por la que los precios difieren en Jimmy’s se puede explicar por la cantidad de ingredientes. Nuevamente, el 100% de la variabilidad en el precio del sándwich se explica por la variabilidad de los ingredientes. Los precios difieren porque las coberturas difieren.
Al día siguiente hice lo mismo y me senté afuera de Fozzie’s durante 7 días y recogí los pedidos de otros 100 clientes. Y al final de la semana volví a casa, tracé los puntos en un gráfico y descubrí que podía explicar el precio usando la siguiente ecuación. Precio = $ 5 + $ 0.64 (# de ingredientes) y R2 = 82%.
En Fozzie’s, es una historia diferente. Si bien el modelo explica el 82% de cómo difirió el precio, no explica todas las diferencias de precio. Hay otras razones, además de la cantidad de ingredientes, por las que dos sándwiches pueden costar de manera diferente. Una vez más, el 82% de las diferencias de precios se pueden explicar por las diferencias en el número de precios. El otro 28% está en los residuos. Son inexplicables. El modelo no explica esa parte. Nuevamente, lo que R2 le dice es que el porcentaje de la variabilidad en Y que se explica por el modelo.
Una de las áreas en las que los analistas están utilizando R2 es en el área de los modelos de factores de riesgo. Específicamente, están diseñando modelos para gestionar los riesgos asociados a sus carteras con énfasis en minimizar los riesgos. Estos modelos se benefician de los continuos aumentos en el poder computacional, así como de los desarrollos recientes que brindan puntos de datos adicionales como los recientes colapsos repentinos y la crisis crediticia de 2008.
Análisis e interpretación
Como dije antes, r-cuadrado es una medida de qué tan bien una línea en particular primero un conjunto de observaciones.
¿Para qué se utiliza R-Squared?
Los inversores utilizan la medida r-cuadrado para comparar el rendimiento de una cartera con el mercado más amplio y predecir las tendencias que podrían ocurrir en el futuro. Por ejemplo, supongamos que un inversor quiere comprar un fondo de inversión que está fuertemente correlacionado con el S&P 500. El inversor buscaría un fondo que tenga un valor r cuadrado cercano a 1. Cuanto más se acerque el valor a 1, el más correlacionado es.
Supongamos que el inversor puede elegir entre tres fondos con valores R2 de .5, .7 y .9. El inversor debe elegir el fondo .9 porque su rendimiento está más correlacionado con el S&P 500.
Explicaciones y precauciones de uso
¿Quién usa R-cuadrado?
Algunas de las áreas dentro de la industria financiera donde se usa r cuadrado incluyen:
Rendimiento de los fondos mutuos – Los inversores utilizan R cuadrado dentro de la industria de fondos mutuos como una medida histórica que representa cómo los movimientos de los fondos se correlacionan con un índice de referencia. Además, normalmente se indica en el prospecto de un fondo). Este número se calcula primero trazando los rendimientos mensuales de los fondos mutuos frente a su índice de referencia (es decir, S&P 500).
Por ejemplo, puede ver que el r-cuadrado de un fondo es .75 o 75%. En otras palabras, una r-cuadrada alta en relación con el S&P 500, significa que su ‘correlación con el resaltado (o se mueve dentro del tándem). Utilizándolo en un ejemplo, puede ver cómo le está yendo a un fondo en relación con un índice de referencia (es decir, este mes el S&P bajó un -5% y el fondo bajó un -4%).
Los fondos de cobertura – utilizar r-cuadrado para determinar qué tan bien sus modelos de riesgo, incluida la ayuda a identificar cuánto riesgo están asociados con los factores.
Cepo – Dentro de la industria financiera para ayudar a determinar qué tan bien se correlaciona el movimiento de las acciones con el mercado, sería necesario observar la “r-cuadrada” de la regresión, también conocida como el coeficiente de determinación. Una R cuadrada cercana a uno sugiere que gran parte del movimiento de las acciones puede explicarse por el movimiento de los mercados; una pérdida de r cuadrado a cero sugiere que la acción se mueve independientemente del mercado en general. En el caso de las acciones y los bonos, las proporciones suelen ser más bajas.