Coursera Learner working on a presentation with Coursera logo and
Coursera Learner working on a presentation with Coursera logo and

Mit der Inferenzstatistik versuchen Sie, zu Lösungen zu gelangen, die über die schnelle Information hinausgehen. So versuchen wir zum Beispiel anhand von Statistiken, aus den Beispielinformationen zu erahnen, was die Bevölkerung denken könnte. Oder aber wir nutzen inferentielle Statistiken, um Entscheidungen über die Wahrscheinlichkeit zu treffen, dass eine beobachtete Unterscheidung zwischen den Versammlungen zuverlässig ist oder dass sie bei dieser Untersuchung zufällig aufgetreten sein könnte. Daher nutzen wir inferentielle Einsichten, um aus unseren Informationen Schlussfolgerungen zu immer breiteren Bedingungen zu ziehen; wir nutzen aufschlussreiche Messungen, um grundsätzlich darzustellen, was in unseren Informationen geschieht.

Hier konzentriere ich mich auf die Inferenzstatistik, die bei der Forschungsstruktur von Versuchen und Halbtests oder bei der Bewertung von Programmergebnissen hilfreich ist. Vielleicht wird einer der am wenigsten schwierigen Inferenztests angewandt, wenn man über die normale Durchführung von zwei Versammlungen auf einer Einzelmaßnahme nachdenken muss, um zu prüfen, ob es einen Unterschied gibt. Sie sollten wissen, ob junge Männer und junge Frauen der achten Klasse bei den Testergebnissen in Mathematik variieren, oder ob ein Programm, das sich auf das Ergebnismaß bezieht, von einer Kontrollversammlung abweicht. An welchem Punkt Sie auch immer über die normale Ausführung zwischen zwei Versammlungen nachdenken wollen, sollten Sie den t-Test für die Kontraste zwischen den Versammlungen in Betracht ziehen.

Der größte Teil der wichtigsten schlussfolgernden Erkenntnisse stammt aus einer allgemeinen Gruppe messbarer Modelle, die als das Allgemeine Lineare Modell bekannt sind. Dies umfasst den t-Test, die Varianzanalyse (ANOVA), die Kovarianzanalyse (ANCOVA), die Rückfalluntersuchung und eine beträchtliche Anzahl von multivariaten Techniken wie die Faktorenuntersuchung, die multidimensionale Skalierung, die Gruppenuntersuchung, die Untersuchung der diskriminierenden Arbeit usw. Angesichts der Bedeutung des allgemeinen linearen Modells ist es ein kluger Gedanke für jeden echten Sozialwissenschaftler, sich mit seinen Operationen vertraut zu machen. Die Rede vom allgemeinen linearen Modell ist hier äußerst rudimentär und betrachtet nur das am wenigsten komplexe geradlinige Modell. Wie dem auch sei, es wird Sie mit den Möglichkeiten des direkten Modells vertraut machen und Ihnen helfen, sich auf die unten dargestellten komplizierteren Untersuchungen vorzubereiten.

Einer der Schlüssel dazu, wie über Versammlungen gedacht wird, liegt in der Idee der “Dummy”-Variablen. Der Name suggeriert nicht, dass wir Variablen verwenden, die nicht scharfsinnig sind, oder, weitaus schrecklicher, dass der Prüfer, der sie verwendet, ein “Dummy” ist! Vielleicht würden diese Variablen besser als “Zwischen”-Variablen dargestellt werden. Im Grunde genommen ist eine gefälschte Variable eine Variable, die diskrete Zahlen, normalerweise 0 und 1, verwendet, um zu verschiedenen Versammlungen in Ihrer Untersuchung zu sprechen. Dummy-Variablen sind ein geradliniger Gedanke, der dazu führt, dass einige wirklich verwirrende Dinge passieren können. Indem ich beispielsweise eine einfache Scheinvariable in ein Modell einfüge, kann ich zwei separate Zeilen (eine für jede Behandlungssammlung) mit einem einsamen Zustand anzeigen. Um zu erkennen, wie dies funktioniert, schauen Sie sich den Austausch von Dummy-Variablen an.

Eine der wichtigsten Untersuchungen bei der Bewertung von Programmergebnissen ist die Gegenüberstellung von Programm- und Nichtprogramm-Bündel in Bezug auf die Ergebnisvariable oder -faktoren. Wie wir dies tun, hängt von der Prüfungsstruktur ab, die wir verwenden. Die Forschungspläne sind in zwei signifikante Arten von Strukturen unterteilt: Test und Halbtest. Da die Prüfungen für jeden unterschiedlich sind, werden sie unabhängig voneinander angezeigt.

Sondierende Analyse. Die einfache, zweifach randomisierte Untersuchung nach dem Test wird normalerweise mit dem t-Test oder der einseitigen ANOVA durchgeführt. Die faktoriellen Versuchsstrukturen werden normalerweise mit dem Modell der Varianzanalyse (ANOVA) untersucht. Randomisierte Blockdesigns verwenden eine ungewöhnliche Art von ANOVA-Blockierungsmodell, das scheinbar kodierte Faktoren verwendet, um mit den Quadraten zu sprechen. Die Analyse der Kovarianz-Experimentalplanung verwendet, wie jeder erwarten könnte, das messbare Modell der Kovarianzanalyse.

Semi-experimentelle Analyse. Die Strukturen der Halbprozedur unterscheiden sich von den Teststrukturen insofern, als sie keine willkürliche Aufgabe zur Zuteilung von Einheiten (z.B. Einzelpersonen) an Programmzusammenkünfte verwenden. Das Fehlen einer willkürlichen Aufgabe in diesen Plänen wird ihre Prüfung im Allgemeinen eindrucksvoll zusammenfassen. Um zum Beispiel das Nonequivalent Groups Design (NEGD) zu analysieren, müssen wir die Pre-Test-Scores für Schätzfehler in einem Modell, das regelmäßig als zuverlässigkeitskorrigierte Kovarianzanalyse bezeichnet wird, modifizieren. Beim Regressions-Diskontinuitäts-Design sollten wir uns besonders um die Krümmung und die Fehlspezifizierung des Modells sorgen. Daher werden wir im Allgemeinen einen konservatorischen Untersuchungsansatz verwenden, der von einem polynomischen Rückfall abhängt, der mit einer Überanpassung der vermuteten echten Kapazität beginnt und danach das Modell in Abhängigkeit von den Ergebnissen verringert. Das Regressionspunkt-Verschiebungsdesign hat nur eine einzeln behandelte Einheit. Nach und nach hängt die Prüfung der RPD-Konfiguration direkt vom üblichen ANCOVA-Modell ab.

Wenn Sie diese verschiedenen diagnostischen Modelle untersucht haben, werden Sie sehen, dass sie alle aus einer ähnlichen Familie stammen – dem allgemeinen linearen Modell. Ein Verständnis dieses Modells wird Sie mit der Komplexität der Informationsrecherche in der angewandten und Sozialforschung vertraut machen.