La covarianza y la conexión son dos términos fundamentalmente utilizados en el campo de las percepciones y las hipótesis de probabilidad. La mayoría de los artículos y materiales de análisis sobre probabilidad y conocimientos suponen una comprensión fundamental de términos como métodos, desviación estándar, conexiones, tamaños de prueba y covarianza. Denos la oportunidad de desmitificar dos o tres de estos términos hoy para que podamos seguir adelante con el resto. El objetivo del artículo es caracterizar los términos: marcos de relación y covarianza, separar entre los dos y comprender el uso de los dos en el campo de la investigación y los conjuntos de datos.

Estoy haciendo un registro para una simple referencia a los sujetos:

Desmitificando los términos

Caracterización de los términos científicamente

Covarianza versus Conexión

Aplicación en la investigación

Desmitificando los términos

En palabras básicas, ambos términos miden la relación y la dependencia entre dos variables. La “covarianza” demuestra el curso de la conexión directa entre los factores. La “conexión”, entonces, de nuevo mide tanto la calidad como la dependencia de la conexión directa entre dos factores. Una relación es un elemento de la covarianza. Lo que los separa es la forma en que las estimaciones de relación están institucionalizadas, aunque las estimaciones de covarianza ciertamente no lo están. Se puede obtener el coeficiente de relación de dos factores separando la covarianza de estos factores por el resultado de las desviaciones estándar de cualidades similares. Por si acaso volvemos al significado de la Desviación Estándar, básicamente mide la absoluta inconstancia de la apropiación de un conjunto de datos. En el momento en que se aíslan las estimaciones de covarianza por la desviación estándar, básicamente reduce el incentivo a un ámbito restringido de – 1 a +1. Este es decisivamente el alcance de las estimaciones de conexión.

Caracterización de los términos científicamente

Denos ahora la oportunidad de visitar el significado científico de estos términos.

Si miramos una sola variable, digamos ‘y’, cov(y,y), la expresión puede ser escrita de la siguiente manera:

Actualmente, como vemos, en la imagen de arriba, “s²” o cambio probado es esencialmente la covarianza de una variable consigo misma. Este término también puede caracterizarse de la siguiente manera:

En la fórmula anterior, el numerador de la ecuación (A) se conoce como el conjunto de desviaciones al cuadrado. En la ecuación(B) con dos factores x e y, se conoce como el agregado de los elementos cruzados. En la ecuación anterior, n es el número de pruebas de la colección de información. El valor (n-1) muestra los grados de oportunidad.

Correlación

El coeficiente de conexión se llama también el coeficiente de relación del minuto del artículo de Pearson, o coeficiente de relación de Pearson. Como se ha mencionado antes, se adquiere aislando la covarianza de los dos factores por el resultado de sus desviaciones estándar. La representación científica del equivalente puede aparecer de manera complementaria:

Las estimaciones del coeficiente de relación pueden ir de – 1 a +1. Cuanto más cerca esté de +1 o – 1, más intensamente se conectan los dos factores. El signo positivo implica el encabezamiento de la conexión, por ejemplo, en el caso de que uno de los factores se construya, se espera que la otra variable también se incremente.

Representación matricial de datos de covarianza y correlación

Sumerjámonos un poco más profundamente y echemos un vistazo a la representación del marco de la covarianza.

Para una matriz de datos, X donde X puede ser representado de la siguiente manera:

un vector ‘xj’ sugeriría fundamentalmente un (n × 1) vector extraído de la sección j-ésima de X donde j tiene un lugar con el conjunto (1,2,… .,p). Además ‘xi” habla al vector (1 × p) de la línea I-ésima de X. Aquí ‘I’ puede tomar un incentivo del conjunto (1,2,… ,n). También puede traducirse X como una cuadrícula de variable donde ‘xij’ es la variable j-ésima (segmento) recogida de la cosa I-ésima (empuje). Para simplificar la referencia, llamemos a los empujes como cosas/sujetos y a las secciones como factores. Veamos ahora la media de una columna de la matriz de datos anterior:

Definamos ahora el significado de la fila. Es básicamente el promedio de los elementos presentes en la fila especificada.

Ahora que tenemos las métricas anteriores, será más fácil definir la matriz de covarianza (S):

En la matriz anterior, vemos que el elemento de la red de covarianza es p × p. Esta es básicamente una matriz simétrica, es decir, una matriz cuadrada que es igual a su transposición (S`). Los términos que construyen el marco de covarianza se conocen como los cambios de una variable dada, que conforman la desviación de la red o la covarianza de 2 factores que coronan el resto del espacio. La covarianza de la variable j-ésimo con la variable k-ésimo es idéntica a la covarianza de la variable k-ésimo con la variable j-ésimo, por ejemplo “sjk”= “skj”.

Podemos hacer la matriz de covarianza a partir de la matriz de datos de la siguiente manera:

Aquí, ‘Xc’ es un entramado enfocado que tiene los medios de segmentos particulares sustraídos de cada componente. Utilizando eso como la parte focal, la red de covarianza ‘S’ es el resultado de la transposición de ‘Xc’ y ‘Xc’ en sí misma, que luego es separada por el número de cosas o columnas (‘n’) en la red de información.

Anteriormente, avanzamos más, volvamos a la idea de la fluctuación de prueba o s-cuadrado (s²). Podemos inferir la desviación estándar de una colección de información de este valor. La aritmética caracteriza el valor ‘s’ como la desviación estándar del índice de información. Muestra fundamentalmente el nivel de dispersión o propagación de la información alrededor de su normal.

Como vemos aquí, el elemento de la matriz de conexión es de nuevo p × p. Actualmente, en el caso de que echemos un vistazo a los componentes individuales de la red de conexión, la inclinación fundamental implica 1. Esto demuestra que la conexión de un componente consigo mismo es 1, o el valor más notable que se pueda concebir. Esto es un buen augurio, inteligente y natural. Diferentes componentes “rjk” es el coeficiente de conexión de Pearson entre dos cualidades: “xj” y “xk”. Como vimos antes, “xj” indica la sección j-ésima de la red de información, X. A continuación se explica cómo se puede obtener la matriz de correlación a partir de la matriz de datos:

Las “X” de la definición anterior se conocen como la escala o la cuadrícula institucionalizada. Aquí vemos que la red de relaciones puede caracterizarse como el resultado de la transposición de la estructura escalada consigo misma, dividida por ‘n’. Volviendo al significado de la desviación estándar de arriba, vemos que cada componente (como la red de covarianza de arriba) del marco institucionalizado “Xs” está separado por la desviación estándar de la sección individual. Esto refuerza nuestra comprensión de que la red de relaciones es un subordinado institucionalizado o escalado de la matriz de covarianza.