Registrar los segmentos principales

Ya que PCA trabaja mejor con información numérica, se excluyen los dos factores directos (versus y am). Te quedas con una red de 9 secciones y 32 líneas, que vas al trabajo de prcomp(), asignando tu rendimiento a mtcars.pca. De igual manera, establecerás dos contenciones, foco y escala, para que sean válidas. En ese punto puedes echar un vistazo a tu objeto PCA con outline().

Adquieres 9 segmentos de cabeza, que llamas PC1-9. Cada uno de ellos aclara un nivel de la variedad total del conjunto de datos. En otras palabras: PC1 aclara el 63% de la fluctuación total, lo que implica que casi el 66% de los datos del conjunto de datos (9 factores) pueden ser ejemplificados por una sola parte de la cabeza. El PC2 aclara el 23% del cambio. De esta manera, conociendo la situación de un ejemplo en conexión con simplemente PC1 y PC2, se puede obtener una visión precisa de dónde permanece en conexión con los diferentes ejemplos, ya que sólo PC1 y PC2 pueden aclarar el 86% de la fluctuación.

¿Qué tal si llamamos a str() para ver su objeto PCA.

No describiré los resultados aquí en detalle, sin embargo, su objeto PCA contiene los datos que lo acompañan:

El punto medio ($centro), la escala ($escala), la desviación estándar (sdev) de cada parte importante

La relación (conexión o anticorrelación, etc.) entre los factores subyacentes y las partes importantes ($rotación)

Las estimaciones de cada ejemplo en cuanto a los segmentos clave ($x)

Comprensión de la recaída estratégica en Python

Averigua sobre la recaída estratégica, sus propiedades esenciales, y monta un modelo de IA en una aplicación certificable en Python.

Los procedimientos de arreglo son una pieza fundamental de las aplicaciones de la inteligencia artificial y la minería de información. Aproximadamente el 70% de los temas de la Ciencia de la Información son temas de agrupación. Hay un montón de cuestiones de ordenación que son accesibles, sin embargo, la recaída de coordenadas es normal y es una estrategia de recaída útil para ocuparse de la cuestión de la doble caracterización. Otra clase de agrupación es una disposición Multinomial, que se ocupa de las cuestiones en las que se dispone de diferentes clases en la variable objetivo. Por ejemplo, el conjunto de datos del IRIS es un caso bien conocido de arreglo multiclase. Diferentes modelos están arreglando la clase artículo/bloque/archivo.

La recaída calculada puede utilizarse para diferentes cuestiones de caracterización, por ejemplo, el descubrimiento de spam. La expectativa de la diabetes, si un cliente determinado comprará un artículo específico o vencerá a otro contendiente, sin importar si el cliente se conectará o no a un aviso dado, y muchos más modelos están en el cubo.

La recaída calculada es uno de los cálculos más básicos y generalmente utilizados de la IA para un orden de dos clases. Es cualquier cosa menos difícil de actualizar y puede utilizarse como estándar para cualquier cuestión de caracterización paralela. Sus ideas de cosas esenciales son igualmente útiles en el aprendizaje profundo. La recaída calculada retrata y evalúa la conexión entre una variable paralela subordinada y los factores autónomos.

En este ejercicio instructivo, se familiarizarán con las cosas que acompañan a la recaída calculada:

Prólogo a la recaída estratégica

Recaída directa contra recaída calculada

Estimación de la probabilidad más extrema frente a la técnica habitual del mínimo cuadrado

¿Cómo funciona la recaída estratégica?

Modelo de trabajo en Scikit-learn

Evaluación del modelo utilizando la Red de Perplejidad.

Puntos de interés e inconvenientes de la recaída estratégica

Recaída estratégica

La recaída estratégica es una técnica medible para anticiparse a las clases dobles. La variable resultado u objetivo es de naturaleza dicotómica. Dicotómico implica que sólo hay dos clases potenciales. Por ejemplo, puede ser muy bien utilizada para cuestiones de localización de malignidades. Procesa la probabilidad de un evento ocasional.

Es un caso poco común de reincidencia directa en el que la variable objetiva está en la naturaleza. Utiliza un registro de cambios como variable dependiente. La recaída calculada predice la probabilidad del evento de una ocasión doble utilizando el trabajo de logit.

Condición de recaída recta:

Donde, y es una variable dependiente y x1, x2… también, Xn es un factor lógico.

Capacidad del sigmoide:

Aplicar la capacidad sigmoidea en la recaída directa:

Propiedades de la recaída estratégica:

La variable necesitada en la recaída estratégica persigue a la Circulación de Bernoulli.

La estimación se hace a través de la mayor probabilidad.

No R Square, el bienestar del modelo se determina a través de la Concordancia, KS-Insights.

Recaída directa contra recaída estratégica

La recaída directa le da un rendimiento incesante, pero la recaída calculada le da un rendimiento consistente. Un caso de rendimiento incesante es el costo de la casa y el costo de las acciones. El caso del rendimiento discreto es anticipar si un paciente tiene una malignidad o no, prever si el cliente se agitará. La recaída directa se evalúa utilizando los mínimos cuadrados estándar (OLS) mientras que la recaída calculada se evalúa utilizando el enfoque de la estimación de la mayor probabilidad (MLE).

Estimación de la probabilidad más extrema contra la técnica del mínimo cuadrado

El MLE es una técnica de aumento de “probabilidad”, mientras que el OLS es una estrategia de suposición que limita la separación. Amplificar el trabajo de probabilidad decide los parámetros que están en camino de entregar la información vigilada. Desde una perspectiva objetiva, la EML establece la media y el cambio como parámetros para decidir las cualidades paramétricas particulares de un modelo dado. Esta disposición de parámetros puede utilizarse para prever la información necesaria en una difusión típica.

Los medidores de mínimos cuadrados normales se procesan ajustando una línea de recaída en los focos de información dados que tiene la totalidad de la base de las desviaciones cuadradas (mínimo error de cuadrado). Ambos se utilizan para medir los parámetros de un modelo de recaída recta. El MLE acepta una capacidad de masa de probabilidad conjunta, mientras que el OLS no requiere ninguna suposición estocástica para limitar la separación.

Capacidad del sigmoide

La capacidad sigmoide, también llamada capacidad calculada, da una curva en forma de ‘S’ que puede tomar cualquier número estimado genuino y guiarlo hacia un incentivo en algún lugar en el rango de 0 y 1. En el caso de que la curva vaya hacia un ilimitado positivo, y anticipado obtendrá 1, y si la curva va hacia un ilimitado negativo, y anticipado obtendrá 0. En el caso de que el rendimiento de la capacidad sigmoidea sea superior a 0,5, podemos organizar el resultado como 1 o Efectivamente, y en el caso de que sea inferior a 0,5, podemos caracterizarlo como 0 o NO. El resultado no puede ser el modelo For: Si el rendimiento es de 0,75, podemos decir en cuanto a la probabilidad de que haya un 75 por ciento de probabilidades de que el paciente experimente los efectos nocivos del crecimiento maligno

Una especie de recaída estratégica:

Doble recaída estratégica: La variable objetivo tiene sólo dos resultados potenciales, por ejemplo, Spam o No Spam, Malignidad o No Enfermedad.

Recaída calculada multinacional: La variable objetivo tiene al menos tres clasificaciones ostensibles, por ejemplo, anticipando el tipo de Vino.

Recaída estratégica ordinal: la variable objetivo tiene al menos tres clasificaciones ordinales, por ejemplo, comedor o elemento que evalúa del 1 al 5.