Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Covariância e conexão são dois termos fundamentalmente utilizados no campo das perspectivas e hipóteses de probabilidade. A maioria dos artigos e material de leitura sobre verosimilhança e hipóteses de verosimilhança assume uma compreensão fundamental de termos como métodos, desvio padrão, conexões, tamanhos de teste e covariância. Dê-nos uma chance de desmistificar dois ou três desses termos hoje para que possamos avançar com o resto. O objetivo do artigo é caracterizar os termos: relação e quadros de covariância, separar entre os dois e compreender o uso dos dois no campo da investigação e dos conjuntos de dados.

Estou a fazer um registo para uma simples referência aos sujeitos:

Desmistificando os termos

Caracterização Científica dos Termos

Covariância versus Conexão

Aplicação em Investigação

Desmistificando os termos

Em palavras básicas, ambos os termos medem a relação e a dependência entre duas variáveis. “Covariância” demonstra o curso da conexão direta entre os fatores. “Conexão” então novamente mede tanto a qualidade quanto o rolamento da conexão direta entre dois fatores. Uma relação é um elemento da covariância. O que os separa é a forma como a estima das relações é institucionalizada, mas a estima das covariâncias certamente não o é. Você pode obter o coeficiente de relação de dois fatores separando a covariância desses fatores pelo resultado dos desvios padrão de qualidades similares. Na hipótese remota de voltarmos ao significado de Desvio Padrão, ele mede basicamente a inconstância absoluta da apropriação de um conjunto de dados. No momento em que se isola a estima da covariância pelo desvio padrão, basicamente reduz o incentivo a um escopo restrito de – 1 a +1. Este é decisivamente o escopo da estima da conexão.

Caracterização Científica dos Termos

Dá-nos agora uma oportunidade de visitar os significados científicos destes termos.

Se olharmos para uma única variável, digamos ‘y’, cov(y,y), a expressão pode ser escrita da seguinte forma:

Atualmente, como vemos, na figura acima, ‘s² ou mudança testada é essencialmente a covariância de uma variável consigo mesma. Este termo também pode ser caracterizado da seguinte forma:

Na fórmula acima, o numerador da equação(A) é conhecido como o conjunto dos desvios quadráticos. Na equação(B) com dois fatores x e y, é conhecido como o agregado de itens cruzados. Na equação acima, n é o número de testes na coleção de informações. O valor (n-1) mostra os graus de oportunidade.

Correlação

O coeficiente de conexão é chamado de coeficiente de relacionamento minuto do item Pearson, ou coeficiente de relacionamento Pearson. Como mencionado anteriormente, ele é adquirido isolando a covariância dos dois fatores pelo resultado de seus desvios padrão. O retrato científico do equivalente pode aparecer de uma forma complementar:

As estimativas do coeficiente de relação podem estender-se de – 1 a +1. Quanto mais próximo estiver de +1 ou – 1, mais intensamente os dois factores estão ligados. O sinal positivo implica o título da conexão, por exemplo, caso um dos fatores se construa, a outra variável também deverá aumentar.

Representação matricial de dados de Covariância e Correlação

Mergulhemos adicionalmente um pouco mais fundo e vejamos o retrato estrutural da covariância.

Para uma matriz de dados, X onde X pode ser representado da seguinte forma:

um vetor ‘xj’ sugere fundamentalmente um vetor (n × 1) extraído da seção j-th de X onde j tem um lugar com o conjunto (1,2,… .,p). Adicionalmente ‘xi” fala ao vetor (1 × p) da I-ésima linha de X. Aqui ‘I’ pode pegar um incentivo do conjunto (1,2,… ,n). Você também pode traduzir X como uma grade de variável onde ‘xij’ é a j-ésima variável (segmento) reunida a partir da I-ésima coisa (push). Para simplificar a referência, chamemos pushes como coisas/subjectos e secções como factores. Vamos agora olhar para a média de uma coluna da matriz de dados acima:

Vamos agora definir o significado da fila. É basicamente a média dos elementos presentes na fila especificada.

Agora, que temos as métricas acima, será mais fácil definir a matriz de covariância (S):

Na matriz acima, vemos que o elemento da rede de covariância é p × p. his é basicamente uma matriz simétrica, ou seja, uma matriz quadrada que é igual à sua transposição (S`). Os termos construção da estrutura da covariância são conhecidos como as mudanças de uma dada variável, moldando o orvalho da rede ou a covariância de 2 fatores que complementam o restante do espaço. A covariância da variável j-th com a variável k-th é idêntica à covariância da variável k-th com a variável j-th por exemplo ‘sjk’= ‘skj’.

Nós podemos fazer a matriz de covariância a partir da matriz de dados da seguinte forma:

Aqui, ‘Xc’ é uma malha focada que tem o segmento particular significa subtraído de cada componente. Utilizando isso como parte focal, a malha de covariância ‘S’ é o resultado da transposição de ‘Xc’ e do próprio ‘Xc’, que é então separado pelo número de coisas ou colunas (‘n’) na grade de informação.

Anteriormente, avançamos mais, vamos voltar à ideia de flutuação de teste ou s-quadrado (s²). Podemos inferir o desvio padrão de uma coleção informativa a partir deste valor. A aritmética caracteriza o valor ‘s’ como o desvio padrão do índice informativo. Mostra fundamentalmente o nível de dispersão ou propagação da informação em torno do seu valor normal.

Como vemos aqui, o elemento da matriz de conexão é novamente p × p. Atualmente, na hipótese de que nós dêmos uma olhada nos componentes individuais da grade de conexão, a inclinação fundamental envolve todos 1. Isto demonstra que a conexão de um componente com si mesmo é 1, ou o mais notável valor concebível. Isto é um bom presságio inteligente e natural. Componentes diferentes ‘rjk’ é o coeficiente de conexão da Pearson entre duas qualidades: “xj” e “xk”. Como vimos anteriormente, ‘xj’ indica a seção j-ésima da malha de informação, X. Prosseguindo para a forma como a matriz de correlação pode ser obtida a partir da matriz de dados:

Os ‘Xs’ na definição acima é conhecida como a grelha em escala ou institucionalizada. Aqui vemos que a grelha de relacionamento pode ser caracterizada como o resultado da transposição da estrutura em escala consigo mesma, dividida por ‘n’. Ao retornar ao significado de desvio padrão de cima, vemos que cada componente (como a malha de covariância acima) da estrutura institucionalizada ‘Xs’ é separado pelo desvio padrão da seção individual. Isto reforça a nossa compreensão de que a grelha de relações é um subordinado institucionalizado ou em escala da matriz de covariância.

línguas

Weekly newsletter

No spam. Just the latest releases and tips, interesting articles, and exclusive interviews in your inbox every week.