Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Esta lição explica como usar métodos de matriz para gerar uma matriz de variância-covariância a partir de uma matriz de dados brutos.

Variância

A variação é uma proporção da flutuação ou dispersão em muitas informações. Cientificamente, é o desvio normal ao quadrado em relação à pontuação média. Utilizamos a equação de acompanhamento para calcular a variação.

Var(X) = Σ ( Xi – X )2 / N = Σ xi2 / N

onde

N é o número de pontuações em um conjunto de pontuações

X é a média das notas de N.

Xi é a i-ésima pontuação bruta no conjunto de pontuações

xi é a pontuação i no conjunto de pontuações

Var(X) é a variação de todas as pontuações no conjunto

Covariância

Covariância é uma proporção do grau em que a comparação de componentes de dois arranjos de informação solicitada se move de forma semelhante. Nós utilizamos a equação de acompanhamento para processar a covariância.

Cov(X, Y) = Σ ( Xi – X ) ( Yi – Y ) / N = Σ xiyi / N

onde

N é o número de pontuações em cada conjunto de dados

X é a média das notas N no primeiro conjunto de dados

Xi é a pontuação bruta no primeiro conjunto de pontuações

xi é a pontuação i no primeiro conjunto de pontuações

Y é a média das notas de N no segundo conjunto de dados

Yi é a pontuação bruta no segundo conjunto de pontuações

yi é a pontuação iith de desvio no segundo conjunto de pontuações

Cov(X, Y) é a covariância das pontuações correspondentes nos dois conjuntos de dados

Matriz de Variância-Covariância

A variância e a covariância são regularmente mostradas juntas numa malha de covariância diferente, (também conhecida como uma grelha de covariância). As mudanças aparecem ao longo da curva a curva e as covariâncias aparecem nos componentes fora da curva, como demonstrado a seguir

V = Σ x12 / N Σ x1 x2 / N . . .    Σ x1 xc / N  

Σ x2 x1 / N Σ x22 / N . . .    Σ x2 xc / N
. . .    . . .    . . .    . . .
Σ xc x1 / N Σ xc x2 / N . . .    Σ xc2 / N

onde

V é uma matriz de variância-covariância c x c

N é o número de pontuações em cada um dos conjuntos de dados c

xi é uma pontuação de desvio do conjunto de dados ith

Σ xi2 / N é a variação de elementos do conjunto de dados ith

Σ xi xj / N é a covariância para elementos dos conjuntos de dados ith e jth

Como criar uma matriz de variância-covariância

Assumir que X é um n x k de retenção da malha de n x k de informações brutas solicitadas. Por exemplo, o quadro X pode mostrar as pontuações nos testes k para n subestudos, como consta no número 1.

Começando com a informação bruta da grade X, você pode fazer a diferença covariância da malha para mostrar a mudança dentro de cada segmento e a covariância entre segmentos. Aqui está o segredo.

Transforme as notas brutas da matriz X em notas de desvio para a matriz x.

x = X – 11’X ( 1 / n )

onde

1 é um vector de n x 1 colunas de um

x é uma matriz n x k de pontuação de desvio: x11, x12, . . , xnk

X é uma matriz n x k de pontuação bruta: X11, X12, . . , Xnk

Processo x’x, a grelha de desvio k x k de quadrados e itens cruzados para x.

Nesse ponto, divida cada termo na grade de desvio por n dos quadrados e cross item para fazer a diferença da rede de covariância. Ou seja,

V = x’x ( 1/n )

onde

V é uma grade de covariância k x k de flutuação

x’x é o desvio total dos quadrados e da grelha de itens cruzados

n é a quantidade de pontuações em cada seção da primeira grade X

Na próxima seção, leia o Problema 1 para um exemplo mostrando como transformar dados brutos em uma matriz de variância-covariância.