Probablemente ya sepa que siempre que sea posible debe tomar decisiones basadas en datos en el trabajo. En cualquier caso, ¿se da cuenta de cómo analizar la mayoría de la información a la que tiene acceso? Afortunadamente, no necesitas hacer los cálculos por ti mismo (¡gracias a Dios!), pero sí necesitas comprender y traducir efectivamente el examen hecho por tus compañeros.
Para comprender más fácilmente esta estrategia y cómo la utilizan las organizaciones, conversé con Tom Redman, escritor de Data Driven: Beneficiándose de su activo empresarial más importante. Además, él incita a las asociaciones en sus proyectos de información y calidad de la información.
¿Qué es el análisis de regresión?
Redman ofrece esta situación modelo: Supongamos que eres un supervisor de proyecto que intenta prever los números de un mes a partir de ahora. Te das cuenta de que puñados, tal vez incluso muchos componentes desde el clima hasta el avance de un contendiente hasta el chisme de un modelo tan bueno como siempre puede afectar al número. Tal vez los individuos en su asociación incluso tienen una hipótesis sobre lo que tendrá el mayor impacto en los tratos. “Confía en mí. Cuanta más lluvia tengamos, más venderemos.” “Seis semanas después de la promoción del competidor, las ventas aumentan.”
El análisis de regresión es una forma de clasificar matemáticamente cuál de esas variables tiene realmente un impacto. Responde a las preguntas: ¿Qué factores son los más importantes? ¿Cuáles podemos ignorar? ¿Cómo interactúan esos factores entre sí? Y, quizás lo más importante, ¿qué tan seguros estamos de todos estos factores?
En el análisis de regresión, esos factores se llaman variables.
En el examen de la recaída, esos elementos se llaman factores. Tienes tu variable dependiente, el principal factor que intentas entender o predecir. En el modelo de Redman más, la variable dependiente es de mes a mes. Y después de eso tienes tus factores autónomos – los elementos que crees que afectan a tu variable dependiente.
¿Cómo funciona?
Para dirigir una investigación de recaída, reúnes los datos de las variables en cuestión. (Actualización: es probable que no necesites hacer esto sin la ayuda de nadie más, sin embargo es útil para que comprendas el procedimiento que utiliza tu asociado examinador de información). Tomas la mayor parte de tu mes a mes reparte números de, estado, los tres años anteriores y cualquier información sobre los factores libres que te interesan. Por lo tanto, para esta situación, supongamos que usted descubre la precipitación normal de mes a mes para tan lejos como tres años también. En ese punto, se traza la mayoría de los datos en un gráfico que se asemeja a este:
El pivote y es la medida de las ofertas (la variable dependiente, la cosa que te gusta, está consistentemente en el y-hub) y el x-hub es la precipitación total. Cada punto azul habla de la información de un mes, la cantidad que cayó ese mes y el número de ofertas que hiciste ese mes equivalente.
Al mirar esta información, lo más probable es que notes que las ofertas son mayores en los días en que llueve una tonelada. Es fascinante saber eso, sin embargo, ¿en qué cantidad? Si llueve 3 pulgadas, ¿sabes cuánto venderás? ¿Y si llueve 4 pulgadas?
Actualmente imagina dibujar una línea a través del gráfico sobre, una que corra generalmente a través del centro del considerable número de focos de información. Esta línea le permitirá responder, con cierto nivel de convicción, la cantidad que normalmente vende cuando llueve una suma específica.
Se llama línea de regresión y se dibuja (usando un programa estadístico como SPSS o STATA o incluso Excel) para mostrar la línea que mejor se ajusta a los datos. Por así decirlo, aclara Redman, “La línea roja es la mejor aclaración de la conexión entre la variable autónoma y la variable de barrio”.
Además de dibujar la línea, su programa de estadísticas también produce una fórmula que explica la pendiente de la línea y se ve algo así:
Ignora el término de error por ahora. Se refiere al hecho de que la regresión no es perfectamente precisa. Concéntrate en el modelo:
Ignora el término de error por ahora. Se refiere al hecho de que la regresión no es perfectamente precisa. Sólo concéntrese en el modelo:
Lo que esta fórmula te dice es que si no hay “x” entonces Y = 200. De esta manera, de manera verificable, cuando no llovió por ningún tramo de la imaginación, usted hizo un promedio de 200 ventas y usted puede esperar hacer el equivalente a seguir adelante esperando que diferentes factores sigan siendo el equivalente. Además, antes, por cada pulgada extra de lluvia, hacías una normalidad de cinco tratos adicionales. “Por cada adición que x sube uno, y sube cinco”, dice Redman.
Actualmente deberíamos volver al término de error. Usted puede ser tentado a afirmar que el aguacero afecta en gran medida a los tratos si por cada pulgada se obtienen cinco tratos adicionales, sin embargo, si esta variable merece su consideración dependerá del término de error. Una línea de regresión siempre tiene un término de error porque, en la vida real, las variables independientes nunca son predictores perfectos de las variables dependientes. O tal vez la línea es un indicador dependiente de la información accesible. Así que el término de error te revela cuán seguro puedes estar de la receta. Cuanto más grande es, menos segura es la línea de recaída.
El modelo anterior utiliza una sola variable para prever el factor de intriga – para que esta situación de aguacero anticipe los tratos. Normalmente se inicia un análisis de regresión que necesita comprender el efecto de unas pocas variables independientes. Así que puedes incorporar el aguacero así como la información sobre el avance de un contendiente. “Continúas haciendo esto hasta que el término de error es poco”, dice Redman. “Intentas conseguir la línea que mejor se ajusta a tu información”. Aunque puede haber peligros al intentar incorporar un número excesivo de factores en una investigación de reincidencia, los investigadores con talento pueden limitar esos peligros. Es más, pensar en el efecto de varios factores sin un momento de retraso es quizás el mayor margen de maniobra de una recaída.