Los tipos de información son una idea significativa de las percepciones, que deben ser comprendidas, para aplicar eficazmente las estimaciones fácticas a su información y de esta manera cerrar con precisión ciertas presunciones sobre ella. Esta entrada de blog te familiarizará con los diversos tipos de información que tienes que conocer para hacer una investigación exploratoria de información (EDA) apropiada, que es una de las partes más poco pensadas de una empresa de IA.

Lista de capítulos:

Prólogo a los tipos de información

Toda la información (ostensible, ordinal)

Información numérica (discreta, consistente, provisional, proporcional)

¿Por qué los tipos de información son importantes?

Técnicas de hechos

Rundown

Prólogo a los tipos de información

Tener una comprensión decente de los diversos tipos de información, llamados adicionalmente escalas de estimación, es un elemento esencial urgente para realizar la Investigación Exploratoria de la Información (EDA), ya que se pueden utilizar ciertas estimaciones fácticas sólo para tipos de información explícita.

Además, necesitas saber qué tipo de información estás manejando para elegir la técnica de representación correcta. Considere los tipos de información como un enfoque para clasificar varios tipos de factores. Hablaremos de los tipos fundamentales de factores y echaremos un vistazo a un modelo para cada uno. De vez en cuando aludiremos a ellos como escalas de estimación.

Información absoluta

La información absoluta habla de cualidades. A lo largo de estas líneas, puede hablar de cosas como el sexo de un individuo, el lenguaje, etc. Toda nuestra información puede igualmente tomar estima numérica (Modelo: 1 para la mujer y 0 para el hombre). Nótese que esos números no tienen significado numérico.

Información ostensible

Las estimaciones ostensibles hablan de unidades discretas y se utilizan para marcar factores que no tienen valor cuantitativo. Simplemente considéralas “etiquetas”. Obsérvese que la información ostensible que no tiene organización. Por lo tanto, en la remota posibilidad de que cambie la petición de sus cualidades, la importancia no cambiaría. Puede ver dos ejemplos de resaltes ostensibles debajo:

El componente izquierdo que retrata el sexo de una persona se llamaría “dicotómico”, que es una especie de escala ostensible que contiene sólo dos clases.

Información ordinal

Las estimaciones ordinarias hablan de unidades discretas y solicitadas. Es de esta manera equivalente a la información ostensible, pero de nuevo, en realidad es un asunto de solicitud. Puedes ver un modelo debajo:

Nótese que la distinción entre la Escuela Básica y la Escuela Secundaria no es la misma que el contraste entre la Escuela Secundaria y la Escuela. Este es el confinamiento fundamental de la información ordinal, los contrastes entre las cualidades no son generalmente conocidos. Así, las escalas ordinales se utilizan generalmente para medir los aspectos destacados no numéricos como la alegría, la lealtad de los consumidores, etc.

Información numérica

1. Información discreta

Hablamos de información discreta si sus cualidades son inconfundibles y aisladas. Por así decirlo: Hablamos de información discreta si la información puede adquirir cualidades específicas. Este tipo de información no puede ser estimada, sin embargo tiende a ser comprobada. Fundamentalmente habla de datos que pueden ser ordenados. Un modelo es el número de cabezas en 100 tiradas de moneda.

Puede comprobar, preguntando a las dos consultas adjuntas, si está manejando información discreta o no: ¿Sería capaz de contarla y podría ser dividida en partes más y más pequeñas?

2. Información persistente

La información persistente habla de estimaciones y de esta manera, sus cualidades no pueden ser contadas de la manera en que pueden ser estimadas. Un modelo sería la estatura de un individuo, que se puede retratar utilizando interinos en la línea numérica genuina.

Información provisional

Las estimaciones provisionales se refieren a las unidades solicitadas que tienen una distinción similar. Posteriormente, discutimos la información provisional cuando tenemos una variable que contiene cualidades numéricas que son solicitadas y donde conocemos los contrastes definidos entre las cualidades. Un modelo sería un elemento que contiene la temperatura de un punto dado como se puede ver debajo:

El problema con la información de las cualidades provisionales es que no tienen un “cero verdadero”. Eso implica, en lo que respecta a nuestro modelo, que no hay nada parecido a una temperatura. Con la información provisional, podemos incluir y restar, sin embargo, no podemos duplicar, aislar o determinar las proporciones. Como no hay un cero evidente, no se pueden aplicar muchos conocimientos esclarecedores e inferenciales.

Información sobre la proporción

Las estimaciones de proporción son unidades adicionales solicitadas que tienen una distinción similar. Las estimaciones de proporción equivalen a cualidades intermedias, con la distinción de que tienen un cero a cero. Los modelos auténticos son la estatura, el peso, la longitud y así sucesivamente.

¿Por qué los tipos de información son importantes?

Los tipos de datos son una idea significativa a la luz del hecho de que deben utilizarse estrategias mensurables con tipos de información específicos. Es necesario desglosar la información persistente de manera única, en contraste con la información directa, de lo contrario se produciría un examen fuera de la base. Por consiguiente, conocer los tipos de información que estás manejando, te permite elegir la estrategia correcta para la investigación.

En la actualidad, volveremos a repasar cada tipo de dato, pero esta vez con respecto a qué estrategias mensurables se pueden aplicar. Para ver apropiadamente de lo que hablaremos actualmente, es necesario comprender los rudimentos de las ideas iluminadoras. En el caso de que no los conozcas, puedes leer con detenimiento mi entrada en el blog (9 minutos de lectura): https://towardsdatascience.com/introduction to-clear insights 252e9c464ac9.

Técnicas de hechos

Información ostensible

En el momento en que se gestiona la información aparente, se recogen datos a través de:

Frecuencias: La recurrencia es la tasa a la que algo sucede en algún tramo de tiempo o dentro de un conjunto de datos.

Extensión: Puedes calcular la extensión sin mucho esfuerzo dividiendo la recurrencia por el número total de ocasiones. (por ejemplo, la regularidad con la que algo sucedió aislado por la frecuencia con la que podría ocurrir)

Tasa.

Estrategias de percepción: Para imaginar la información ostensible se puede utilizar un diagrama de pastel o un gráfico de barras.

En la ciencia de la información, se puede utilizar una codificación de un solo paso, para cambiar la información aparente en un componente numérico.

Información ordinal

En el momento en que se gestiona la información ordinal, se pueden utilizar estrategias similares a las de la información ostensible, pero también se pueden utilizar algunos dispositivos adicionales. De esta manera, puedes abreviar tu información ordinal con frecuencias, alcances, tasas. También, puedes imaginarlo con diagramas de pastel y barras. También puedes utilizar percentiles, medios, modos y el rango intercuartil para condensar tu información.

En la ciencia de la información, se puede utilizar una codificación de nombres, para cambiar la información ordinal en un componente numérico.

Información constante

En el momento en que se gestiona la información constante, se pueden utilizar la mayoría de las estrategias para retratar la información. Puedes condensar tu información utilizando percentiles, medio, intercuartil go, media, modo, desviación estándar y rango.

Estrategias de representación:

Para obtener información consistente, puedes utilizar un histograma o un diagrama de caja. Con un histograma, puedes comprobar la inclinación focal, la variabilidad, la metodología y la curtosis de un transporte. Ten en cuenta que un histograma no puede mostrarte en la remota posibilidad de que tengas alguna anomalía. Esta es la razón por la que usamos adicionalmente gráficos de cajas.