Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

El objetivo de este post es darle una oportunidad a todos los más propensos a usar la recaída de borde que simplemente usar lo que dan las bibliotecas. En ese punto, “¿Qué es la recaída de borde?”. El enfoque menos complejo para abordar la investigación es “Variedad de recaída directa”. El camino más notablemente terrible es, para empezar con las condiciones científicas que lo acompañan muy pocos pueden comprender desde el principio.

La terrible noticia es que a pesar de todo lo que necesitamos para manejarlo y la noticia edificante es que no comenzaremos con las condiciones de esa manera, pero no actualmente. Lo que yo podría querer en primer lugar es ‘Standard Least Squares (OLS)’. En la remota posibilidad de que tengas una base casi nula sobre la recaída directa, este video te ayudará a sentir cómo funciona la técnica del “Mínimo Cuadrado”. Actualmente, se dan cuenta de que la OLS es muy parecida a lo que llamamos “recaída directa”, y utilizaré el término en todos los aspectos.

Antes de seguir adelante

En los siguientes segmentos, adoptaré varias estrategias con diferentes términos y cifras. Hay dos cosas que debería recordar. Una es que no nos importa la sobrecarga. Al final del día, generalmente nos inclinamos hacia un modelo que obtiene ejemplos generales. La otra es que nuestro objetivo es preverlo a partir de nueva información, no de información explícita. En esta línea, la evaluación del modelo debe basarse en nueva información (conjunto de pruebas), no en información dada (conjunto de preparación). Además, utilizaré los términos complementarios recíprocamente.

Variable autónoma = Resaltar = Propiedad = Indicador = X

Coeficiente = Beta = β

Sobras del agregado de cuadrados = RSS

¿Por qué y por qué no OLS

Least Square Strategy encuentra los mejores y más justos coeficientes

Puede que te des cuenta de que la estrategia del menor cuadrado encuentra los coeficientes que mejor se ajustan a la información. Una condición más a incluir es que también encuentre los coeficientes sin prejuicios. Aquí “sin prejuicios” implica que la OLS no piensa en qué factor libre tiene mayor prioridad que otros. Esencialmente encuentra los coeficientes para un índice de información dado. Por lo tanto, sólo hay un lote de betas que se encuentran en el más mínimo ‘Total de Cuadrados Restantes (RSS)’. La pregunta en ese punto se convierte en “¿Es un modelo con el más mínimo RSS realmente el mejor modelo?”.

Predisposición versus cambio

La respuesta a la pregunta anterior es “No tanto”. Como se indica en la palabra “justo”, tenemos que considerar también “inclinación”. La inclinación implica cuán similarmente un modelo piensa sobre sus indicadores. Supongamos que hay dos modelos para anticipar el costo de una manzana con dos indicadores “dulzura” y “chispa”; un modelo es imparcial y el otro es unilateral.

Para empezar, el modelo justo trata de descubrir la conexión entre los dos aspectos destacados y los costes, de forma similar a la estrategia de la OLS. Este modelo se ajustará a las percepciones de la forma más consumada posible para limitar el RSS. En cualquier caso, esto podría, sin mucho esfuerzo, llevar a problemas de sobreajuste. Como tal, el modelo no se ejecutará también con nueva información ya que se trabaja para la información dada de manera tan explícita que puede no ajustarse a la nueva información.

El modelo unilateral reconoce sus factores inconsistentes para tratar cada indicador de una manera inesperada. Volviendo al modelo, tendríamos que pensar en la “dulzura” para montar un modelo y esto debería funcionar mejor con nueva información. La explicación se aclarará después de entender la inclinación versus el cambio. En caso de que tengas curiosidad sobre la predisposición versus el punto de fluctuación, te prescribo enfáticamente que veas este video que te dará entendimiento.

Muy bien puede decirse que la predisposición está conectada con un modelo que no encaja en el conjunto de la preparación y la diferencia está conectada con un modelo que no encaja en el conjunto de la prueba. La inclinación y la diferencia están en el intercambio de la relación sobre la complejidad del modelo, lo que implica que un modelo sencillo tendría una alta predisposición y un bajo cambio, y al revés. En nuestro modelo de la manzana, un modelo que sólo considere la “dulzura” no se ajustaría a la información de la preparación tanto como el otro modelo que considera tanto la “dulzura” como la “chispa”, sin embargo, el modelo más directo será mejor para prever la nueva información.

Esto se basa en que la “dulzura” es un determinante de un costo mientras que la “chispa” no debería serlo por un juicio sensato. Todos sabemos esto como un humano, sin embargo los modelos numéricos no piensan como nosotros y simplemente averiguan lo que se da hasta que descubre alguna conexión entre cada uno de los indicadores y la variable autónoma para encajar la información de preparación.

Donde la regresión de la cresta entra en juego

Echando un vistazo a la figura de Predisposición versus Cambio, el Y-hub es “Error” que es el “Total de Predisposición y Fluctuación”. Dado que estos dos están esencialmente relacionados con la caída de la llanura, podríamos querer limitarlos. Actualmente investigando la figura intensamente, encontrarás que la detección del error total es menor en algún lugar del centro. Esta es una regla llamada “punto dulce”.

Deberíamos revisar que la OLS trata cada uno de los factores de manera similar (justa). De esta manera, un modelo OLS resulta ser cada vez más alucinante a medida que se incluyen nuevos factores. Se puede decir muy bien que un modelo OLS se sitúa sistemáticamente en la parte más derecha de la figura, teniendo la inclinación más reducida y la diferencia más notable. Está fijo allí, nunca se mueve, pero tenemos que moverlo al punto dulce. Aquí es cuando la recaída de los bordes brillaría, adicionalmente aludido como Regularización. En la recaída de borde, se puede afinar el parámetro lambda con el objetivo de que los coeficientes del modelo cambien. Esto se puede comprender mejor con una demostración de programación que se presentará hacia el final.

Comprensión geométrica de la recaída en el borde

Comúnmente, un realista obtiene el sentimiento de cómo funciona un modelo y la recaída de borde no es un caso especial. La figura que acompaña es la traducción geométrica para pensar en la MLA y la recaída de borde.

Formas y medidor OLS

Cada forma es una asociación de puntos donde el RSS es el equivalente, enfocado con el indicador OLS donde el RSS es el menor. Además, el indicador OLS es donde mejor se ajusta al conjunto de preparación (baja predisposición).

Círculo y medidor de bordes

No es para nada como el indicador OLS, el indicador de borde cambia cuando el tamaño del círculo azul cambia. Es justo donde el círculo se encuentra con la forma más externa. La forma en que funciona la recaída del borde es la forma en que afinamos el tamaño del círculo. El punto clave es que el cambio de β a un nivel alternativo.

Supongamos que β1 es “chispa” y β2 es “dulzura”. Como debería ser obvio, el borde β1 generalmente cae más rápidamente a cero que el borde β2 lo hace a medida que el tamaño del círculo cambia (piense en las dos figuras). La motivación detrás de por qué ocurre esto es porque los β cambian de forma contrastante por el RSS. De forma más natural, las formas no son círculos, sin embargo, los óvalos se sitúan inclinados.

Languages

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.