Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Esta lección explica cómo utilizar los métodos matriciales para generar una matriz de varianza-covarianza a partir de una matriz de datos en bruto.

Variación

La varianza es una proporción de la fluctuación o difusión de una gran cantidad de información. Científicamente, es la desviación cuadrada normal de la puntuación media. Utilizamos la ecuación adjunta para calcular el cambio de figuras.

Var(X) = Σ ( Xi – X )2 / N = Σ xi2 / N

donde

N es el número de resultados en un conjunto de resultados…

X es la media de las puntuaciones N.

Xi es la puntuación bruta número uno en el conjunto de puntuaciones…

xi es la puntuación de la desviación i en el conjunto de puntuaciones

Var(X) es la variación de todas las puntuaciones del conjunto

Covarianza

La covarianza es una proporción del grado en que la comparación de los componentes de dos arreglos de la información solicitada se mueve de manera similar. Utilizamos la ecuación adjunta para procesar la covarianza.

Cov(X, Y) = Σ ( Xi – X ) ( Yi – Y ) / N = Σ xiyi / N

donde

N es el número de puntuaciones en cada conjunto de datos

X es la media de las puntuaciones de N en el primer conjunto de datos

Xi es el puntaje bruto en el primer conjunto de puntajes…

xi es la puntuación de la desviación i en el primer conjunto de puntuaciones

Y es la media de las puntuaciones N en el segundo conjunto de datos

Yi es el puntaje bruto en el segundo conjunto de puntajes…

yi es la puntuación de desviación i en el segundo conjunto de puntuaciones

Cov(X, Y) es la covarianza de las puntuaciones correspondientes en los dos conjuntos de datos

Matriz de varianza-covarianza

La varianza y la covarianza se muestran regularmente juntas en una red de covarianza de diferencia (también conocida como red de covarianza). Los cambios se muestran de esquina a esquina y las covarianzas se muestran en los componentes desviados, como se demuestra a continuación

V =     Σ x12 / N Σ x1 x2 / N . . .    Σ x1 xc / N   Σ x2 x1 / N Σ x22 / N . . .    Σ x2 xc / N . . .    . . .    . . .    . . . Σ xc x1 / N Σ xc x2 / N . . .    Σ xc2 / N

donde

V es una matriz de varianza-covarianza c x c

N es el número de puntuaciones en cada uno de los conjuntos de datos c

xi es una puntuación de desviación del conjunto de datos ith

Σ xi2 / N es la varianza de elementos del conjunto de datos ith

Σ xi xj / N es la covarianza para los elementos de los conjuntos de datos ith y jth

Cómo crear una matriz de varianza-covarianza

Supongamos que X es un entramado de n x k que contiene los arreglos solicitados de información cruda. Por ejemplo, el entramado X puede mostrar las puntuaciones en los exámenes k de n suplentes, como aparece en la edición 1.

Comenzando con la información cruda de la cuadrícula X, puedes hacer una red de covarianza diferente para mostrar el cambio dentro de cada segmento y la covarianza entre los segmentos. Aquí está el secreto.

Transformar las puntuaciones brutas de la matriz X en puntuaciones de desviación para la matriz x.

x = X – 11’X ( 1 / n )

donde

1 es un vector de n x 1 columna de unos

x es una matriz n x k de puntuaciones de desviación: x11, x12, … …xnk…

X es una matriz de n x k de puntuaciones brutas: X11, X12, … , Xnk

Procesa x’x, la desviación k x k conjuntos de cuadrados y cuadrículas de ítems cruzados para x.

En ese punto, divide cada término en los conjuntos de desviación de los cuadrados y la cuadrícula de elementos cruzados por n para hacer la red de covarianza de la diferencia. Es decir,

V = x’x ( 1/n )

donde

V es una cuadrícula de covarianza de fluctuación k x k

x’x es el total de la desviación de los cuadrados y de la cuadrícula de la partida cruzada

n es la cantidad de puntuaciones en cada sección de la primera cuadrícula X

En la siguiente sección, lea el Problema 1 para ver un ejemplo que muestra cómo convertir los datos en bruto en una matriz de varianza-covarianza.