Os Tipos de Informação são uma idéia significativa de insights, que deve ser compreendida, para aplicar efetivamente estimativas factuais às suas informações e, desta forma, fechar com precisão certas suposições sobre elas. Esta entrada no blog irá familiarizá-lo com os vários tipos de informação que você tem que conhecer, para fazer uma investigação de informação exploratória (EDA) apropriada, que é uma das poucas partes mais pensadas de um empreendimento de IA.

Lista capítulo por capítulo:

Prólogo para Tipos de Informação

Todas as informações (Ostensible, Ordinal)

Informação Numérica (Discreta, Consistente, Interina, Proporcional)

Por que os tipos de informação são significativos?

Técnicas Factuais

Rundown

Prólogo para Tipos de Informação

Ter uma compreensão decente dos vários tipos de informação, também chamados de escalas de estimativa, é uma necessidade urgente para fazer a Investigação Exploratória de Informação (EDA), uma vez que você pode utilizar certas estimativas factuais apenas para tipos de informação explícita.

Você também precisa saber que tipo de informação você está conseguindo escolher a técnica correta de representação. Considere os tipos de informação como uma abordagem para classificar vários tipos de fatores. Vamos falar sobre os tipos de fatores fundamentais e dar uma olhada em um modelo para cada um deles. De vez em quando, faremos alusão a eles como escalas de estimativa.

Informações Absolutas

Informações absolutas falam de qualidades. Nesta linha, ela pode falar com coisas como o sexo de um indivíduo, língua e assim por diante. Todas as informações podem também ter estima numérica (Modelo: 1 para feminino e 0 para masculino). Note que esses números não têm significado numérico.

Informações Ostensíveis

Estimativas ostensivas falam a unidades discretas e são utilizadas para marcar fatores, que não têm valor quantitativo. Basta considerá-los “etiquetas”. Note que informações ostensivas que não têm organização. Portanto, na hipótese remota de que você mudaria o pedido por suas qualidades, o significado não mudaria. Você pode ver dois exemplos de destaques ostensivos em baixo:

O componente esquerdo que retrata o sexo de uma pessoa seria chamado de “dicotômico”, que é uma espécie de escalas ostensivas que contém apenas duas classes.

Informação Ordinal

Estimativas ordinais falam às unidades discretas e solicitadas. É desta forma que se trata de equivalente a informações ostensivas, então, mais uma vez, na verdade, está solicitando assuntos. Você pode ver um modelo abaixo:

Note que a distinção entre o Ensino Fundamental e o Ensino Médio não é a mesma que o contraste entre o Ensino Médio e a Escola. Este é o confinamento fundamental da informação ordinal, os contrastes entre as qualidades não são geralmente conhecidos. Assim, as escalas ordinais são geralmente utilizadas para medir os destaques não-numéricos como a alegria, a lealdade do consumidor, etc.

Informações Numéricas

1. Informações Discretas

Falamos de informação discreta se suas qualidades são inconfundíveis e isoladas. Por assim dizer: Falamos de informação discreta se a informação pode apenas assumir qualidades específicas. Este tipo de informação não pode ser estimado, porém tende a ser verificado. Fundamentalmente fala de dados que podem ser organizados em ordem. Um modelo é o número de cabeças em 100 moedas.

Você pode verificar perguntando às duas perguntas que acompanham se você está gerenciando informações discretas ou não: Você seria capaz de contabilizá-la e ela seria capaz de ser dividida em partes mais pequenas e mais pequenas?

2. Informações Persistentes

Informações Persistentes falam a estimativas e desta forma, suas qualidades não podem ser contadas, porém podem ser estimadas. Um modelo seria a estatura de um indivíduo, que você pode retratar utilizando os intermédios na linha de números genuínos.

Informações Interinas

Estimativas provisórias falam às unidades solicitadas que têm uma distinção semelhante. Posteriormente, discutimos informações interinas quando temos uma variável que contém qualidades numéricas que são solicitadas e onde conhecemos os contrastes definitivos entre as qualidades. Um modelo seria um elemento que contém a temperatura de um determinado ponto, como você pode ver abaixo:

A questão com informações de qualidades interinas é que eles não têm um “verdadeiro zero”. Isso implica, em relação ao nosso modelo, que não há nada do gênero como a ausência de temperatura. Com informações interinas, podemos incluir e subtrair, porém, não podemos duplicar, isolar ou determinar proporções. Como não há zero evidente, uma grande quantidade de insights esclarecedores e inferenciais não pode ser aplicada.

Informações de Proporção

As estimativas de proporção são unidades adicionais solicitadas que têm uma distinção semelhante. As estimativas da proporção são equivalentes às qualidades interinas, com a distinção de que elas têm um zero zero. Modelos genuínos são estatura, peso, comprimento e assim por diante.

Por que os tipos de informação são significativos?

Os tipos de dados são uma idéia significativa à luz do fato de que estratégias mensuráveis devem ser utilizadas com tipos de informação específicos. Você precisa quebrar informações persistentes de forma única em contraste com informações diretas, caso contrário, isso traria um exame off-base. Assim, conhecer os tipos de informação que você está gerenciando, capacita você a escolher a estratégia certa para a investigação.

Atualmente vamos rever cada tipo de dado, desta vez com relação ao que estratégias mensuráveis podem ser aplicadas. Para ver apropriadamente do que falaremos atualmente, você precisa compreender os rudimentos de insights esclarecedores. Caso você não tenha nenhum conhecimento sobre eles, você pode ler a entrada do meu blog (9min leia): https://towardsdatascience.com/introduction too-clear insights 252e9c464ac9.

Técnicas Factuais

Informações Ostensíveis

No momento em que você está gerenciando informações ostensivas, você coleta dados através delas:

Freqüências: Recorrência é a taxa em que algo acontece em algum trecho do tempo ou dentro de um conjunto de dados.

Extensão: Você pode, sem muito estiramento, calcular a extensão dividindo a recorrência pelo número de ocasiões. (por exemplo, a regularidade com que algo aconteceu isolado pela freqüência com que poderia ocorrer).

Avalie.

Estratégias de Percepção: Para imaginar informações ostensivas, você pode utilizar um diagrama de torta ou um gráfico de barras.

Em Ciência da Informação, você pode utilizar a codificação em um único ponto, para transformar informações ostensivas em um componente numérico.

Informação Ordinal

No ponto em que você está gerenciando informações ordinais, você pode utilizar estratégias similares como com informações ostensivas, porém você também se aproxima de alguns dispositivos extras. Desta forma, você pode resumir suas informações ordinais com frequências, extensões, taxas. Além disso, você pode imaginá-la com diagramas de torta e barras. Além disso, você pode utilizar percentis, meio, modo e a faixa interquartil para condensar suas informações.

Em Ciência da Informação, você pode utilizar uma codificação de nome, para transformar informações ordinais em um componente numérico.

Informações Constantes

No momento em que você está gerenciando informações constantes, você pode utilizar a maioria das estratégias para retratar suas informações. Você pode condensar suas informações utilizando percentis, meio, go interquartil, média, modo, desvio padrão e faixa.

Estratégias de Representação:

Para visualizar informações consistentes, você pode utilizar um histograma ou um engradado. Com um histograma, você pode verificar a inclinação focal, a capacidade de mudança, a metodologia e a curtose de um transporte. Note que um histograma não pode mostrar a você na hipótese de que você tenha alguma anomalia. Este é o motivo pelo qual usamos adicionalmente box-plots.