Pseudokod
Programiści i naukowcy zajmujący się danymi najczęściej używają terminu pseudokod w odniesieniu do zadań programowania i uczenia maszynowego. Za pomocą pseudokodu programista przedstawia swoje...
Czyszczenie danych
Algorytmy uczenia maszynowego mogą gromadzić, przechowywać i analizować dane oraz generować wartościowe wyniki. Narzędzia te pozwalają ocenić stan skomplikowanych i pogrupowanych danych. Można również...
Kodowanie na gorąco
Kodowanie kategorialne to technika kodowania danych kategorycznych. Należy pamiętać, że dane kategoryczne to zbiory zmiennych, które zamiast wartości liczbowych zawierają zmienne etykietowe. Wiele algorytmów...

Wieloliniowość
Dzięki coraz bardziej zaawansowanym algorytmom uczenia maszynowego i głębokiego uczenia, można rozwiązać niemal każdy problem przy użyciu odpowiednich zbiorów danych. Jednak wraz ze wzrostem...

Test chi
Podczas tworzenia modelu uczenia maszynowego można napotkać wiele problemów. Jednym z powszechnych problemów związanych z wyborem cech jest określenie, jak istotne są cechy wejściowe...
NLP i opieka zdrowotna
NLP lub przetwarzanie języka naturalnego jest technologią w ramach sztucznej inteligencji, która pomaga maszynom zrozumieć ludzki język. Z pomocą NLP inżynierowie łączą dziedzinę informatyki...

Zrozumienie BERT
Niewystarczające dane dotyczące szkoleń to prawdopodobnie najtrudniejszy problem, przed którym stoi przetwarzanie języka naturalnego, lepiej znanego jako NLP. Dla tych, którzy nie wiedzą, NLP...

Baza danych MNIST
Baza danych MNIST (Changed National Organization of Benchmarks and Innovation database) jest ogromną bazą ręcznie zapisywanych cyfr, która zazwyczaj jest wykorzystywana do przygotowania różnych...
Fałszywy negatyw
Podczas rozumienia hipotezy dwa błędy mogą być dość mylące. Te dwa błędy to błąd fałszywie ujemny i błąd fałszywie dodatni. Błąd fałszywie ujemny można...

Przegląd wykresów pudełkowych
Box plot lub box and whisker plot pomagają wyświetlić rozkład bazy danych na pięciocyfrowym podsumowaniu. Pierwszy kwartyl Q1 będzie minimum, trzeci kwartyl Q3 będzie...

Sieci bayesowskie
Stworzenie modelu probabilistycznego może być wyzwaniem, ale okazuje się pomocne w uczeniu maszynowym. Aby stworzyć taki model graficzny, musisz znaleźć probabilistyczne zależności pomiędzy zmiennymi....

Trendy w Data Science w 2021 r.
Rok 2020 był rokiem pełnym wyzwań dla niemal wszystkich. Choć był pełen niespodziewanych wydarzeń, pozwolił na wdrożenie nowych rozwiązań w świecie cyfrowym. Na świecie...
Proste objaśnienie koncepcji backpropagacji
Backpropagacja jest niezbędnym narzędziem lub algorytmem do wprowadzania usprawnień w przypadku uzyskania złych wyników w nauce maszynowej i eksploracji danych. Kiedy dostarczasz wiele danych...

Wprowadzenie do t-SNE
Wymiarowość Spadek W przypadku, gdy miałeś już okazję pracować z zestawem danych z wieloma podkreśleniami, możesz zrozumieć, że tak trudno jest zrozumieć lub zbadać...
Najlepsze IDE Pythona
Pisanie kodu za pomocą Python Shell lub IDLE nie jest trudnym zadaniem. Jednak używanie tych narzędzi w dużych projektach może być onieśmielające. Dlatego do...

Oszacowanie maksymalnego prawdopodobieństwa
Jako naukowiec zajmujący się danymi, powinieneś zrozumieć właściwe techniki interpretacji mechanizmu działania modelu. Interpretacja jest istotnym aspektem nauki o danych. Za każdym razem, gdy...

Straty logarytmiczne
W uczeniu maszynowym, można rozwiązać modelowanie predykcyjne poprzez problemy klasyfikacji. Dla każdej obserwacji w modelu, musisz przewidzieć etykietę klasy. Dane wejściowe będą zawierały dowolną...
Widzenie komputerowe i opieka zdrowotna
Od dziesięcioleci zapowiadaliśmy erę robotów w świecie wirtualnym, ale przez te wszystkie lata ludzie byli sceptyczni. Aż do kilku lat nie byli pewni, czy...
R-CNN, szybki R-CNN, szybszy R-CNN, YOLO – Algorytmy detekcji obiektów
R-CNN Aby odsunąć na bok kwestię wyboru niezliczonych obszarów, Ross Girshick i inni zaproponowali technikę, w której wykorzystujemy specyficzne dążenie do oddzielenia od obrazu...

Wspólne rozkazy Gita
Praca z Gitem na linii zamówień może być przytłaczająca. Aby temu zaradzić, zebraliśmy listę normalnych kierunków działania Gita, metod i sposobów ich wykorzystania. Oczekujemy,...
Co to jest krzywa Lorenza?
Co to jest krzywa Lorenza? Amerykański ekonomista, Max Lorenz, wprowadził pojęcie krzywej Lorenza w 1905 roku. Zaproponował on graficzne przedstawienie nierówności majątkowych lub dochodowych....
Tokenizacja
Tokenizacja nie jest nowym pojęciem, ponieważ ludzie często wykorzystują ją w blockchainie. Koncepcja tokena jest jednak starsza niż blockchain. Wiele osób uważa słowo token...

Dekompozycja wartości pojedynczej
Analiza składowych głównych i dekompozycja wartości pojedynczych to jedne z dwóch popularnych pojęć algebry liniowej w uczeniu maszynowym. Czy po zebraniu surowych danych możliwe...