Poisson-VerteilungInformationstypen sind eine signifikante Idee von Einsichten, die verstanden werden sollten, um sachliche Einschätzungen effektiv auf Ihre Informationen anzuwenden und auf diese Weise bestimmte Vermutungen darüber genau zu schließen. Dieser Blogeintrag macht Sie mit den verschiedenen Informationstypen vertraut, die Sie kennen müssen, um eine angemessene explorative Informationsuntersuchung (EDA) durchführen zu können, die einer der am wenigsten beachteten Teile einer KI Unternehmung ist.

Kapitel für Kapitel aufgelistet:

Prolog zu den Informationstypen

Alle unsere Informationen (scheinbar, ordinal)

Numerische Informationen (diskret, konsistent, vorläufig, proportional)

Warum sind Informationstypen von Bedeutung?

Sachliche Techniken

Rundown

Prolog zu den Informationsarten

Ein angemessenes Verständnis der verschiedenen Informationstypen, die zusätzlich als Schätzskalen bezeichnet werden, ist für die Durchführung von Exploratory Information Investigation (EDA) dringend erforderlich, da Sie bestimmte faktische Schätzungen nur für explizite Informationstypen verwenden können.

Zusätzlich müssen Sie wissen, welchen Informationstyp Sie verwalten, um die richtige Darstellungstechnik auszuwählen. Betrachten Sie Informationstypen als einen Ansatz, um verschiedene Arten von Faktoren zu sortieren. Wir werden über die grundlegenden Arten von Faktoren sprechen und einen Blick auf ein Modell für jede einzelne werfen. Ab und zu werden wir auf sie als Schätzskalen anspielen.

Absolute Informationen

Absolute Information spricht für Qualitäten. In diesem Sinne kann sie zum Beispiel das Geschlecht, die Sprache usw. eines Menschen ansprechen. Alle unsere Informationen können ebenfalls numerische Wertschätzung annehmen (Modell: 1 für weiblich und 0 für männlich). Beachten Sie, dass diese Zahlen keine numerische Bedeutung haben.

Angebliche Informationen

Scheinbare Wertschätzungen sprechen diskrete Einheiten an und werden benutzt, um Faktoren zu markieren, die keinen quantitativen Wert haben. Betrachten Sie sie einfach als “Etiketten”. Beachten Sie, dass vorgebliche Informationen, die keine Organisation haben. Daher würde sich für den Fall, dass Sie die Anfrage nach ihren Qualitäten ändern würden, die Bedeutung nicht ändern. Unten sehen Sie zwei Beispiele für vorgebliche Hervorhebungen:

https://miro.medium.com/max/1800/0*KUbI9s0EGs5dXznj.png

Die linke Komponente, die das Geschlecht einer Person darstellt, würde als “dichotom” bezeichnet, was eine Art vorgebliche Skala ist, die nur zwei Klassen enthält.

Ordinale Informationen

Ordentliche Wertschätzungen sprechen zu diskreten und angeforderten Einheiten. Auf diese Weise ist es in etwa gleichbedeutend mit vorgeblichen Informationen, während es sich in Wirklichkeit um erbetene Angelegenheiten handelt. Sie können unten ein Modell sehen:

https://miro.medium.com/max/1114/0*JaiYvZgwhxiaAXRK.png

Beachten Sie, dass die Unterscheidung zwischen Grund- und Sekundarschule nicht dasselbe ist wie der Kontrast zwischen Sekundarschule und Schule. Dies ist die grundlegende Beschränkung der gewöhnlichen Information, die Kontraste zwischen den Qualitäten sind nicht allgemein bekannt. Daher werden ordinale Skalen im Allgemeinen verwendet, um nichtnumerische Höhepunkte wie Freude, Konsumententreue usw. zu messen.

Numerische Information

1. Diskrete Informationen

Wir sprechen von diskreter Information, wenn ihre Eigenschaften unverwechselbar und isoliert sind. Sozusagen: Wir sprechen von diskreter Information, wenn die Information gerade bestimmte Qualitäten annehmen kann. Diese Art von Information kann nicht geschätzt werden, aber sie wird tendenziell überprüft. Sie spricht im Grunde genommen von Daten, die sich ordnen lassen. Ein Modell ist die Anzahl der Köpfe in 100 Münzflips.

Sie können überprüfen, ob Sie diskrete Informationen verwalten oder nicht, indem Sie die beiden begleitenden Anfragen stellen: Wären Sie in der Lage, sie zu zählen, und könnten sie in kleinere und kleinere Teile aufgeteilt werden?

2. Anhaltende Informationen

Persistente Informationen sprechen für Einschätzungen, und auf diese Weise können ihre Qualitäten nicht bewertet werden, wie auch immer sie geschätzt werden können. Ein Modell wäre die Statur eines Individuums, die Sie durch die Verwendung von Zwischenräumen auf der echten Zahlenlinie darstellen können.

Vorläufige Informationen

Zwischenzeitliche Wertschätzungen sprechen zu ersuchten Einheiten, die eine ähnliche Unterscheidung haben. Anschliessend besprechen wir vorläufige Informationen, wenn wir eine Variable haben, die numerische Qualitäten enthält, die angefordert werden und bei der wir die eindeutigen Kontraste zwischen den Qualitäten kennen. Ein Modell wäre ein Element, das die Temperatur einer bestimmten Stelle enthält, wie Sie unten sehen können:

https://miro.medium.com/max/1786/0*HfJxbqNmzoe2L05_.png

Das Problem bei der Information über die vorläufigen Qualitäten ist, dass sie keine “wahre Null” haben. Das bedeutet in Bezug auf unser Modell, dass es nichts dergleichen gibt wie keine Temperatur. Mit vorläufigen Informationen können wir einschließen und subtrahieren, aber wir können sie nicht duplizieren, isolieren oder Proportionen ermitteln. Da es keinen offensichtlichen Nullpunkt gibt, können viele aufklärende und schlussfolgernde Erkenntnisse nicht angewendet werden.

Informationen zu Proportionen

Anteilsschätzungen sind zusätzlich erbetene Einheiten, die eine ähnliche Unterscheidung aufweisen. Anteilsbewertungen sind gleichbedeutend mit Zwischenqualitäten, mit dem Unterschied, dass sie eine glatte Null haben. Echte Vorbilder sind Statur, Gewicht, Länge und so weiter.

https://miro.medium.com/max/1640/0*148a5xL5-Hr-g4ip.png

Warum sind Informationstypen von Bedeutung?

Datentypen sind ein wichtiger Gedanke angesichts der Tatsache, dass bei bestimmten Informationstypen messbare Strategien angewendet werden müssen. Sie müssen persistente Informationen im Gegensatz zu reinen Informationen eindeutig aufschlüsseln, sonst würde dies zu einer Untersuchung außerhalb der Basis führen. Wenn Sie also wissen, welche Arten von Informationen Sie verwalten, sind Sie in der Lage, die richtige Strategie für die Untersuchung auszuwählen.

Wir werden derzeit jeden Datentyp noch einmal durchgehen, diesmal jedoch im Hinblick darauf, welche messbaren Strategien angewandt werden können. Um angemessen zu sehen, worüber wir derzeit sprechen werden, müssen Sie die Grundlagen aufschlussreicher Einsichten verstehen.

Faktische Techniken

Scheinbare Informationen

An dem Punkt, an dem Sie vorgebliche Informationen verwalten, sammeln Sie Daten durch:

Häufigkeiten: Wiederholung ist die Rate, mit der etwas über einen bestimmten Zeitraum oder innerhalb eines Datensatzes geschieht.

Ausmaß: Sie können ohne große Streckung das Ausmaß beziffern, indem Sie die Häufigkeit der Wiederholung nach der insgesamt überwiegenden Anzahl von Gelegenheiten aufteilen. (z.B. wie regelmäßig etwas isoliert geschah, indem man die Häufigkeit, mit der es auftreten konnte, aufschlüsselt)

Bewerten.

Wahrnehmungsstrategien: Um sich vorgebliche Informationen vorzustellen, können Sie ein Torten- oder Balkendiagramm verwenden.

https://miro.medium.com/max/1800/0*4mLeITXXwOQnSD9g.png

In der Informationswissenschaft können Sie die One-Hot-Codierung verwenden, um vorgebliche Informationen in eine numerische Komponente umzuwandeln.

Ordinale Information

An dem Punkt, an dem Sie ordinale Informationen verwalten, können Sie ähnliche Strategien wie bei vorgeblichen Informationen anwenden, Sie gehen jedoch ebenfalls einige zusätzliche Geräte an. Auf diese Weise können Sie Ihre ordinale Information mit Häufigkeiten, Ausmaßen, Raten kürzen. Sie können sich das auch mit Torten- und Balkendiagrammen vorstellen. Außerdem können Sie Perzentile, Mitte, Modus und den Interquartilsbereich verwenden, um Ihre Informationen zu verdichten.

In der Informationswissenschaft können Sie eine Namenskodierung verwenden, um ordinale Informationen in eine numerische Komponente umzuwandeln.

Konstante Information

An dem Punkt, an dem Sie konstante Informationen verwalten, können Sie die meisten Strategien zur Darstellung Ihrer Informationen anwenden. Sie können Ihre Informationen unter Verwendung von Perzentilen, Mittelwert, Interquartilen-Go, Mittelwert, Modus, Standardabweichung und Bereich verdichten.

Darstellungsstrategien:

Um konsistente Informationen darzustellen, können Sie ein Histogramm oder ein Kistendiagramm verwenden. Mit einem Histogramm können Sie die Fokalneigung, Veränderlichkeit, Methodik und Wölbung eines Transportmittels überprüfen. Beachten Sie, dass ein Histogramm Ihnen nicht mit dem Zufall zeigen kann, dass Sie irgendwelche Anomalien haben. Dies ist der Grund, weshalb wir zusätzlich Box-Plots verwenden.