Poisson DistributionInformation Types są znaczącym pojęciem, które powinno być zrozumiałe, aby skutecznie zastosować faktyczne szacunki do Twoich informacji i w ten sposób dokładnie zamknąć pewne założenia na ich temat. Ten wpis na blogu zapozna Cię z różnymi rodzajami informacji, które musisz znać, aby zrobić odpowiednie rozpoznanie informacji dochodzenia (EDA), które jest jednym z najbardziej przemyślanych mało części przedsięwzięcia AI.

Lista rozdział po rozdziale:

Prolog do typów informacji

Wszystkie informacje (pozorne, zwyczajne)

Informacje liczbowe (dyskretne, stałe, przejściowe, proporcje)

Dlaczego rodzaje informacji są istotne?

Techniki faktyczne

Rundown

Prolog do typów informacji

Prawidłowe zrozumienie różnych typów informacji, zwanych dodatkowo skalami szacunkowymi, jest pilnie potrzebne do prowadzenia poszukiwań informacji (EDA), ponieważ można wykorzystać pewne szacunki oparte na faktach tylko w przypadku wyraźnych typów informacji.

Dodatkowo musisz wiedzieć, jaki typ informacji udaje Ci się wybrać odpowiednią technikę reprezentacji. Rozważaj typy informacji jako podejście do sortowania różnego rodzaju czynników. Porozmawiamy o podstawowych rodzajach czynników i przyjrzymy się modelowi dla każdego z nich. Raz na jakiś czas będziemy się do nich odnosić jako do skal szacunkowych.

Informacje bezwzględne

Absolutne informacje przemawiają do cech. Wzdłuż tych linii, może mówić do rzeczy takich jak płeć, język i tak dalej. Wszystkie nasze informacje mogą również przyjmować wartości liczbowe (Model: 1 dla kobiet i 0 dla mężczyzn). Zauważ, że te liczby nie mają znaczenia liczbowego.

Informacje pozorne

Pozorne szacunki mówią do dyskretnych jednostek i są wykorzystywane do oznaczania czynników, które nie mają żadnej wartości ilościowej. Po prostu uważaj je za “etykiety”. Zauważ, że pozorne informacje, które nie mają żadnej organizacji. Dlatego też, na wypadek, gdybyś zmienił prośbę o jej cechy, znaczenie nie uległoby zmianie. Pod spodem widzisz dwa przypadki pozornych wyróżników:

https://miro.medium.com/max/1800/0*KUbI9s0EGs5dXznj.png

Lewy składnik, który przedstawia płeć osoby, byłby nazywany “dychotomicznym”, co jest rodzajem pozornej łuski, która zawiera tylko dwie klasy.

Zwykłe informacje

Zwykłe szacunki mówią do dyskretnych i żądanych jednostek. W ten sposób jest to równoznaczne z pozorną informacją, a w rzeczywistości jest to prośba o sprawy. Widzisz model pod spodem:

https://miro.medium.com/max/1114/0*JaiYvZgwhxiaAXRK.png

Należy pamiętać, że rozróżnienie między szkołą podstawową i średnią nie jest takie samo jak kontrast między szkołą średnią i szkołą. Jest to podstawowe ograniczenie zwykłych informacji, kontrasty pomiędzy tymi cechami nie są powszechnie znane. W związku z tym, skale porządkowe są generalnie używane do pomiaru nie-numerycznych informacji, takich jak radość, lojalność konsumentów, itp.

Informacje liczbowe

1. Dyskretne informacje

Rozmawiamy o dyskretnych informacjach, jeśli ich cechy są niepowtarzalne i odizolowane. Tak jakby: Rozmawiamy o dyskretnej informacji, jeśli może ona po prostu przybrać określone cechy. Tego rodzaju informacji nie da się oszacować, jednak zazwyczaj są one sprawdzane. Zasadniczo mówi ona o danych, które można uporządkować. Model to liczba głów w 100 rzutach monetą.

Możesz sprawdzić, czy zarządzasz dyskretnymi informacjami, czy też nie: Czy byłbyś w stanie je zliczyć i czy można by je podzielić na mniejsze i mniejsze części?

2. Trwałe informacje

Trwałe informacje przemawiają do szacunków i w ten sposób ich cechy nie mogą być porównywane, ale można je oszacować. Model byłby rangą jednostki, którą można przedstawić za pomocą interwałów na prawdziwej linii liczbowej.

Informacje tymczasowe

Tymczasowe szacunki przemawiają do jednostek, do których zwrócono się o pomoc, które mają podobne rozróżnienie. Następnie omawiamy informacje tymczasowe, gdy mamy zmienną, która zawiera wymagane cechy liczbowe i gdy znamy konkretne kontrasty między tymi cechami. Model byłby elementem, który zawiera temperaturę danego miejsca, jak widać poniżej:

https://miro.medium.com/max/1786/0*HfJxbqNmzoe2L05_.png

Problem z informacjami o cechach przejściowych polega na tym, że nie mają one “prawdziwego zera”. Oznacza to w odniesieniu do naszego modelu, że nie ma nic takiego, jak brak temperatury. Dzięki informacjom tymczasowym możemy włączać i odejmować, jednak nie możemy powielać, izolować ani ustalać proporcji. Ponieważ nie ma oczywistego zera, nie można zastosować dużej ilości oświecających i inwazyjnych spostrzeżeń.

Informacje o proporcjach

Uznanie proporcjonalne to dodatkowo żądane jednostki, które posiadają podobne rozróżnienie. Wartości proporcjonalne są równoważne jakości tymczasowej, z rozróżnieniem, że mają one wartość zerową. Oryginalne modele to ranga, waga, długość i tak dalej.

https://miro.medium.com/max/1640/0*148a5xL5-Hr-g4ip.png

Dlaczego rodzaje informacji są istotne?

Rodzaje danych są istotne w świetle faktu, że mierzalne strategie muszą być wykorzystywane przy konkretnych rodzajach informacji. Należy rozbić trwałe informacje w odróżnieniu od prostych informacji, gdyż w przeciwnym razie może to doprowadzić do badania poza bazą danych. W związku z tym znajomość rodzajów informacji, którymi się zarządza, upoważnia do wybrania właściwej strategii badania.

Obecnie ponownie przeanalizujemy każdy typ danych, tym razem pod kątem tego, jakie wymierne strategie można zastosować. Aby odpowiednio zobaczyć, o czym będziemy obecnie rozmawiać, należy zrozumieć podstawowe założenia oświecających spostrzeżeń.

Techniki faktyczne

Informacje pozorne

W momencie, gdy zarządzasz pozornymi informacjami, zbierasz dane poprzez:

Częstotliwości: Powtarzalność to tempo, w jakim coś się dzieje na jakimś odcinku czasu lub wewnątrz zbioru danych.

Częstotliwość: Powtarzalność to tempo, w jakim coś się dzieje na pewnym odcinku czasu lub wewnątrz zbioru danych: Możesz bez większego rozciągnięcia określić zakres, dzieląc powtarzalność na wszystkie przypadki. (np. jak regularnie coś się działo, odizolowane od siebie przez częstotliwość występowania)

Stawka.

Strategie postrzegania: Aby wyobrazić sobie pozorne informacje, możesz użyć wykresu kołowego lub słupkowego.

https://miro.medium.com/max/1800/0*4mLeITXXwOQnSD9g.png

W informatyce można zastosować kodowanie “one-hot”, aby zamienić pozorne informacje na składnik liczbowy.

Informacje zwykłe

W momencie, gdy zarządzasz zwykłymi informacjami, możesz zastosować podobne strategie, jak w przypadku informacji pozornych, ale również podejść do niektórych dodatkowych urządzeń. W ten sposób można skrócić informacje porządkowe za pomocą częstotliwości, zakresów, stawek. Można to sobie również wyobrazić za pomocą wykresów kołowych i słupkowych. Ponadto, można wykorzystać percentyle, środek, tryb i zakres międzykwartylowy do skondensowania informacji.

W informatyce można wykorzystać kodowanie jednej nazwy, aby zmienić informacje porządkowe na składową numeryczną.

Informacje stałe

W momencie, gdy zarządzasz stałymi informacjami, możesz wykorzystać większość strategii, aby przedstawić swoje informacje. Możesz skondensować informacje wykorzystując percentyle, środkowy, międzykwartylowy go, średni, tryb, odchylenie standardowe i zasięg.

Strategie reprezentacji:

Aby zobrazować spójne informacje, możesz wykorzystać histogram lub wykres skrzynki. Za pomocą histogramu można sprawdzić nachylenie ogniskowe, zmienność, metodologię i kurtozę przenoszenia. Zwróć uwagę, że histogram nie może pokazać, że masz jakiekolwiek anomalie. Z tego powodu dodatkowo używamy box-plotów.