Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Analiza szeregów czasowych może być techniką statystyczną, która zajmuje się danymi statystycznymi lub analizą. Dane statystyczne oznaczają dane z serii określonych okresów lub przedziałów czasowych. Dane te są uwzględniane w trzech rodzajach:

Dane szeregów czasowych: grupa obserwacji wartości, które dana zmienna przyjmuje w różnych okresach czasu.

Dane przekrojowe: Dane zawierające 1 lub więcej zmiennych, zbierane w równoważnym czasie.

Dane zbiorcze: mieszanina danych szeregów czasowych i danych przekrojowych.

Terminy i pojęcia:

Zależność: Zależność odnosi się do powiązania dwóch obserwacji z równoważną zmienną, w poprzednich punktach czasowych.

Stacjonarność: Pokazuje średnią z szeregów, która jest wciąż stała w danym okresie czasu; jeśli efekty przeszłe kumulują się i dlatego wartości rosną w kierunku nieskończoności, to stationarność nie jest spełniona.

Differencing: nie czyni serii stacjonarnymi, do De-trend i reguluje auto-korelacje; jednakże, przez pewien czas analizy serii nie wymagają różnicowania, a serie zbyt różniące się mogą dawać niedokładne oszacowania.

Specyfikacja: Może obejmować testowanie liniowych lub nieliniowych relacji zmiennych zależnych przy użyciu modeli takich jak ARIMA, ARCH, GARCH, VAR, Co-integration, itp.

Wygładzanie wykładnicze w analizie statystycznej: Metoda ta przewiduje jedną następną wartość okresu obsługiwaną przez wartość przeszłą i bieżącą. Polega ona na uśrednieniu wiedzy z takich niesystematycznych składników każdego indywidualnego przypadku lub obserwacji, które wymazują się wzajemnie. Metoda wygładzania wykładniczego jest stosowana do przewidywania prognoz krótkoterminowych. Alfa, Gamma, Phi i Delta to parametry, które szacują wpływ danych statystycznych. Alfa jest stosowana, gdy sezonowość nie jest obecna w danych. Gamma jest stosowana, gdy w danej serii występuje trend w danych. Delta jest stosowana, gdy w danych występują cykle sezonowości. Stosowany jest model zgodny z wzorcem informacji. Dopasowanie krzywej w analizie statystycznej: Regresja dopasowania krzywej jest stosowana, gdy dane znajdują się w relacji nieliniowej. Kolejne równanie pokazuje zachowanie nieliniowe:

Zmienna zależna, gdzie przypadkiem jest numer przypadku sekwencyjnego.

Dopasowanie krzywej jest często wykonywane przez wybranie “regresji” z menu analizy, a następnie wybranie “estymacji krzywej” z opcji regresji. Następnie wybieramy “pożądana krzywa liniowa”, “moc”, “kwadratowa”, “sześcienna”, “odwrotna”, “logistyczna”, “wykładnicza” lub “inna”.

ARIMA:

ARIMA to skrót od autoregresywnej, zintegrowanej, ruchomej średniej. Metoda ta jest dodatkowo określana jako metoda Box-Jenkinsa.

Identyfikacja parametrów ARIMA:

Składowa autoregresywna: AR oznacza autoregresywny. Parametr autoregresywny oznaczany jest jako p. Gdy p =0, oznacza to, że w serii nie występuje autokorelacja. Gdy p=1, oznacza to, że w serii jest autokorelacja do jednego opóźnienia.

Zintegrowany: W analizie statystycznej ARIMA parametr zintegrowany jest oznaczany jako d. Integracja jest odwrotnością różnicowania. Gdy d=0, oznacza to, że szereg jest nieruchomy i nie musimy brać jego różnicy. Gdy d=1, to znaczy, że szereg nie jest nieruchomy i żeby go utworzyć nieruchomy, chcemy wymagać różnicy pierwotnej. Kiedy d=2, oznacza to, że seria była różna dwa razy. Zwykle, dość duża różnica w czasie nie jest wiarygodna.

Przeciętna składowa ruchoma: MA oznacza przesunięcie typowego, które jest oznaczone przez q. W ARIMA, ruchome średnie q=1 oznacza, że jest to termin błędny i istnieje autokorelacja z jednym opóźnieniem.

Aby sprawdzić, czy seria i jej termin błędu są automatycznie skorelowane, zazwyczaj używamy testu W-D, ACF i PACF.

Dekompozycja: Odnosi się do rozdzielenia statystyki na trendy, efekty sezonowe i pozostałe założenia zmienności:

Stacjonarność: Podstawowym założeniem jest to, że serie są stacjonarne. Zasadniczo sugeruje to, że szeregi są normalnie rozłożone, a zatem średnia i wariancja są stałe w dłuższym okresie czasu.

Niepowiązany błąd losowy: Zakładamy, że pojęcie błędu jest rozłożone losowo, a zatem średnia i wariancja są stałe przez pewien okres czasu. Test Durbin-Watsona jest standardowym testem dla błędów skorelowanych.

Nie ma wartości odstających: Zakładamy, że nie ma żadnych wartości odstających w serii. Wartości odstające mogą silnie wpływać na wnioski i mogą być mylące.

Wstrząsy losowe (element błędu losowego): Jeśli wstrząsy są obecne, zakłada się, że są one rozłożone losowo ze średnią 0 i ciągłą wariancją.

Statistics Solutions może pomóc wraz z ilościową analizą chemiczną, pomagając w opracowaniu metodologii i rozdziałów wyników. Usługi, które świadczymy obejmują:

Plan analizy danych

Edytuj swoje pytania badawcze i hipotezy zerowe/zmienne (null/alternatywne)

Napisz swój plan analizy danych; określ konkretne statystyki, aby zająć się pytaniami badawczymi, założeniami statystyk i uzasadnij, dlaczego są to statystyki dopuszczalne; podaj referencje

Uzasadnij swoją analizę wielkości próbki/mocy, podaj referencje

Wyjaśnij swoją analizę danych, abyś miał poczucie komfortu i pewności.

Dwie godziny dodatkowego wsparcia razem z waszym statystykiem

Sekcja wyników ilościowych (Statystyki opisowe, analizy dwu- i wielowymiarowe, modelowanie równań strukturalnych, analiza ścieżek, HLM, analiza klastrowa)