Statistische Signifikanz

Die Ergebnisse, die mit einem bestimmten Forschungsverfahren erzielt werden, werden genannt statistisch signifikant wenn die Wahrscheinlichkeit ihres zufälligen Auftretens sehr gering ist. Dieses Konzept kann am Beispiel des Münzwurfs verdeutlicht werden. Angenommen, eine Münze wird 30 Mal geworfen; Es kam 17 Mal Kopf und 13 Mal Zahl. Macht es sinnvoll Ist dies eine Abweichung vom erwarteten Ergebnis (15 Kopf und 15 Zahl) oder ist dies ein Zufall? Um diese Frage zu beantworten, können Sie zum Beispiel dieselbe Münze 30 Mal hintereinander werfen und gleichzeitig notieren, wie oft sich das Verhältnis von Kopf und Zahl von 17:13 wiederholt. Die statistische Auswertung erspart uns diesen langwierigen Prozess. Mit seiner Hilfe lässt sich nach den ersten 30 Münzwürfen die mögliche Anzahl zufälliger Vorkommen von 17 Kopf und 13 Zahl abschätzen. Eine solche Schätzung wird als probabilistische Aussage bezeichnet.

IN Wissenschaftliche Literatur nach der arbeitsorganisationspsychologie wird mit dem ausdruck eine probabilistische aussage in mathematischer form bezeichnet R(Wahrscheinlichkeit)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0,01). Diese Tatsache ist wichtig für das Verständnis der Literatur, sollte aber nicht so verstanden werden, dass es sinnlos ist, Beobachtungen zu machen, die diesen Standards nicht genügen. Sogenannte nicht signifikante Forschungsergebnisse (zufällig gewonnene Beobachtungen). mehr ein- oder fünfmal von 100) kann sehr nützlich sein, um Trends zu erkennen und als Leitfaden für zukünftige Forschung.

Es sollte auch beachtet werden, dass nicht alle Psychologen mit traditionellen Standards und Verfahren einverstanden sind (z. B. Cohen, 1994; Sauley & Bedeian, 1989). Probleme im Zusammenhang mit Messungen sind selbst Hauptthema die Arbeit vieler Forscher, die die Genauigkeit von Messmethoden und die zugrunde liegenden Voraussetzungen untersuchen bestehende Methoden und Standards sowie die Entwicklung neuer Schaber und Instrumente. Vielleicht wird die Forschung in dieser Größenordnung irgendwann in der Zukunft zu einer Änderung der traditionellen Standards zur Bewertung der statistischen Signifikanz führen, und diese Änderungen werden allgemeine Akzeptanz finden. (Das fünfte Kapitel der American Psychological Association bringt Psychologen zusammen, die sich auf das Studium von Assessments, Messungen und Statistiken spezialisiert haben.)

In Forschungsberichten ist eine probabilistische Aussage wie z R< 0,05, aufgrund einiger Statistiken das heißt, eine Zahl, die als Ergebnis einer bestimmten Reihe mathematischer Rechenverfahren erhalten wird. Eine probabilistische Bestätigung erhält man, indem man diese Statistiken mit Daten aus speziellen Tabellen vergleicht, die zu diesem Zweck veröffentlicht werden. In der arbForschung werden Statistiken wie z r, F, t, r>(lesen Sie "Chi-Quadrat") und R(lesen Sie "mehrere R"). In jedem Fall können die aus der Analyse einer Reihe von Beobachtungen gewonnenen Statistiken (eine Zahl) mit den Zahlen aus der veröffentlichten Tabelle verglichen werden. Danach ist es möglich, eine probabilistische Aussage über die Wahrscheinlichkeit zu formulieren, diese Zahl zufällig zu erhalten, also einen Rückschluss auf die Signifikanz der Beobachtungen zu ziehen.

Um die in diesem Buch beschriebenen Studien zu verstehen, reicht es aus, ein klares Verständnis des Konzepts der statistischen Signifikanz zu haben und nicht unbedingt zu wissen, wie die oben genannten Statistiken berechnet werden. Es wäre jedoch nützlich, eine Annahme zu diskutieren, die all diesen Verfahren zugrunde liegt. Dies ist die Annahme, dass alle beobachteten Variablen ungefähr nach dem Normalgesetz verteilt sind. Darüber hinaus fallen beim Lesen von Berichten über arForschung oft drei weitere Begriffe auf, die spielen wichtige Rolle Zuerst die Korrelation Korrelation, zweitens die Determinanten-/Prädiktorvariable und "ANOVA" ( Varianzanalyse), drittens eine Gruppe statistischer Methoden unter gemeinsamen Namen„Metaanalyse“.

Betrachten Sie ein typisches Beispiel für die Anwendung statistischer Methoden in der Medizin. Die Schöpfer des Medikaments schlagen vor, dass es die Diurese proportional zur eingenommenen Dosis erhöht. Um diese Annahme zu testen, geben sie fünf Freiwilligen unterschiedliche Dosen des Medikaments.

Entsprechend den Beobachtungsergebnissen wird ein Diagramm der Diurese gegen die Dosis aufgetragen (Abb. 1.2A). Abhängigkeit ist mit bloßem Auge sichtbar. Die Forscher gratulieren einander zu der Entdeckung und der Welt zu dem neuen Diuretikum.

Tatsächlich erlauben uns die Daten nur eine verlässliche Aussage darüber, dass bei diesen fünf Probanden eine Abhängigkeit der Diurese von der Dosis beobachtet wurde. Die Tatsache, dass sich diese Abhängigkeit bei allen Menschen manifestieren wird, die das Medikament einnehmen werden, ist nur eine Vermutung.
W J

Mit

zhenie. Es kann nicht gesagt werden, dass es grundlos ist - warum sonst experimentieren?

Doch jetzt ist das Medikament auf dem Markt. Alle mehr Leute nehmen Sie es in der Hoffnung, ihre Diurese zu erhöhen. Und was sehen wir? Wir sehen Abb. 1.2B, die auf das Fehlen jeglicher Beziehung zwischen der Dosis des Medikaments und der Diurese hinweist. Die schwarzen Kreise repräsentieren Daten aus der ursprünglichen Studie. Die Statistik verfügt über Methoden, um die Wahrscheinlichkeit abzuschätzen, eine solche „nicht repräsentative“, außerdem verwirrende Stichprobe zu erhalten. Es stellt sich heraus, dass ohne einen Zusammenhang zwischen der Diurese und der Dosis des Medikaments die resultierende "Abhängigkeit" in etwa 5 von 1000 Experimenten beobachtet würde. In diesem Fall hatten die Forscher also einfach Pech. Selbst wenn sie die perfektesten statistischen Methoden anwendeten, würde es sie dennoch nicht vor Fehlern bewahren.

Dieses fiktive, aber keineswegs realitätsferne Beispiel haben wir nicht angeführt, um auf die Nutzlosigkeit hinzuweisen
Statistiken. Er spricht über etwas anderes, über die wahrscheinlichkeitstheoretische Natur ihrer Schlussfolgerungen. Als Ergebnis der Anwendung der statistischen Methode erhalten wir nicht die endgültige Wahrheit, sondern nur eine Schätzung der Wahrscheinlichkeit einer bestimmten Annahme. Darüber hinaus basiert jede statistische Methode auf ihrer eigenen mathematisches Modell und seine Ergebnisse sind richtig, soweit dieses Modell der Realität entspricht.

Mehr zu ZUVERLÄSSIGKEIT UND STATISTISCHER SIGNIFIKANZ:

  1. Statistisch signifikante Unterschiede bei den Indikatoren zur Lebensqualität
  2. Statistisches Aggregat. Kontozeichen. Das Konzept der kontinuierlichen und selektiven Forschung. Anforderungen an die statistische Grundgesamtheit und die Verwendung von Rechnungslegungs- und Berichtsunterlagen
  3. ABSTRAKT. STUDIE ZUR ZUVERLÄSSIGKEIT VON TONOMETER-MESSWERTEN ZUR MESSUNG DES AUGENDRUCKS DURCH DAS AUGENLIDER2018, 2018

In jeder wissenschaftlichen und praktischen Situation eines Experiments (Survey) können Forschende nicht alle Menschen (Allgemeinbevölkerung, Bevölkerung) untersuchen, sondern nur eine bestimmte Stichprobe. Selbst wenn wir zum Beispiel eine relativ kleine Gruppe von Menschen untersuchen, z. B. Personen mit einer bestimmten Krankheit, ist es höchst unwahrscheinlich, dass wir die Ressourcen haben oder jeden Patienten testen müssen. Stattdessen wird normalerweise eine Stichprobe der Bevölkerung getestet, da dies bequemer ist und weniger Zeit in Anspruch nimmt. Woher wissen wir in diesem Fall, dass die aus der Stichprobe erhaltenen Ergebnisse die gesamte Gruppe repräsentieren? Oder, um die Fachsprache zu verwenden, können wir sicher sein, dass unsere Studie das Ganze richtig beschreibt Bevölkerung, die Probe, von der wir verwendet haben?

Um diese Frage zu beantworten, ist es notwendig, die statistische Signifikanz der Testergebnisse zu bestimmen. Statistische Signifikanz (Erhebliches Niveau, abgekürzt Sig.), oder /7-Signifikanzniveau (p-Ebene) - ist die Wahrscheinlichkeit, dass ein bestimmtes Ergebnis die Grundgesamtheit, aus der die Stichprobe untersucht wurde, korrekt darstellt. Beachten Sie, dass dies nur ist Wahrscheinlichkeit- Es kann nicht mit absoluter Sicherheit gesagt werden, dass diese Studie die gesamte Bevölkerung korrekt beschreibt. Aus dem Signifikanzniveau kann bestenfalls auf eine hohe Wahrscheinlichkeit geschlossen werden. Steigt also zwangsläufig nächste Frage: Wie hoch sollte das Signifikanzniveau sein, um dieses Ergebnis als korrekte Charakterisierung der Grundgesamtheit zu betrachten?

Bei welchem ​​Wahrscheinlichkeitswert sind Sie beispielsweise bereit zu sagen, dass solche Chancen ausreichen, um ein Risiko einzugehen? Stehen die Chancen bei 10 zu 100 oder 50 zu 100? Was aber, wenn diese Wahrscheinlichkeit höher ist? Was ist mit Quoten wie 90 von 100, 95 von 100 oder 98 von 100? Für eine mit Risiken verbundene Situation ist diese Wahl durchaus problematisch, da sie von den persönlichen Eigenschaften einer Person abhängt.

In der Psychologie wird traditionell angenommen, dass eine Wahrscheinlichkeit von 95 oder mehr von 100 bedeutet, dass die Wahrscheinlichkeit der Richtigkeit der Ergebnisse hoch genug ist, um auf die gesamte Bevölkerung verallgemeinert zu werden. Diese Zahl wurde im Prozess der wissenschaftlichen und praktischen Tätigkeit ermittelt – es gibt kein Gesetz, nach dem sie als Richtschnur gewählt werden sollte (und tatsächlich werden in anderen Wissenschaften manchmal andere Werte des Signifikanzniveaus gewählt).

In der Psychologie wird diese Wahrscheinlichkeit von mehreren operiert auf ungewöhnliche Weise. Anstelle der Wahrscheinlichkeit, dass die Stichprobe eine Grundgesamtheit darstellt, die Wahrscheinlichkeit, dass die Stichprobe eine Grundgesamtheit darstellt stellt nicht dar Bevölkerung. Mit anderen Worten, es ist die Wahrscheinlichkeit, dass die entdeckten Beziehungen oder Unterschiede zufällig und keine Eigenschaft der Population sind. Anstatt also zu sagen, dass die Ergebnisse einer Studie mit einer Wahrscheinlichkeit von 95 zu 100 richtig sind, sagen Psychologen, dass die Wahrscheinlichkeit, dass die Ergebnisse falsch sind, bei 5 zu 100 liegt (ähnlich wie bei 40 zu 100). Richtigkeit der Ergebnisse bedeutet 60 von 100 Chancen zugunsten ihrer Falschheit). Der Wahrscheinlichkeitswert wird manchmal in Prozent ausgedrückt, aber häufiger wird er als geschrieben Dezimalbruch. Beispielsweise werden 10 Chancen von 100 als Dezimalbruch von 0,1 dargestellt; 5 von 100 wird als 0,05 geschrieben; 1 zu 100 - 0,01. Bei dieser Aufzeichnungsform liegt der Grenzwert bei 0,05. Damit ein Ergebnis als korrekt betrachtet wird, muss sein Signifikanzniveau sein unter diese Zahl (denken Sie daran, dass dies die Wahrscheinlichkeit ist, dass das Ergebnis falsch beschreibt die Bevölkerung. Um die Terminologie zu beseitigen, fügen wir hinzu, dass die "Wahrscheinlichkeit eines falschen Ergebnisses" (was korrekter heißt Signifikanzniveau)üblicherweise bezeichnet Lateinischer Buchstabe R. Die Beschreibung der Ergebnisse des Experiments enthält normalerweise eine zusammenfassende Schlussfolgerung, wie z. B. „Die Ergebnisse waren signifikant auf der Ebene der Signifikanz (R(p) weniger als 0,05 (dh weniger als 5 %).

Damit ist das Signifikanzniveau ( R) gibt die Wahrscheinlichkeit an, dass die Ergebnisse Nicht die Bevölkerung vertreten. Nach psychologischer Tradition gelten die Ergebnisse als zuverlässig widerspiegelnd großes Bild wenn Wert R weniger als 0,05 (d. h. 5 %). Dies ist jedoch nur eine probabilistische Aussage und keineswegs eine unbedingte Garantie. In einigen Fällen kann diese Schlussfolgerung falsch sein. Tatsächlich können wir berechnen, wie oft dies passieren kann, wenn wir uns die Größe des Signifikanzniveaus ansehen. Bei einem Signifikanzniveau von 0,05 sind die Ergebnisse in 5 von 100 Fällen wahrscheinlich falsch. 11a scheint auf den ersten Blick nicht allzu oft vorzukommen, aber wenn man darüber nachdenkt, dann sind 5 Chancen von 100 gleich 1 von 20. Anders gesagt, in einem von 20 Fällen dreht sich das Ergebnis heraus, falsch zu sein. Solche Chancen scheinen nicht besonders günstig zu sein, und Forscher sollten sich davor hüten, sich festzulegen Fehler erster Art. So heißt der Irrtum, der auftritt, wenn Forscher glauben, echte Ergebnisse gefunden zu haben, tatsächlich aber keine vorhanden sind. Die entgegengesetzten Fehler, die darin bestehen, dass Forscher glauben, kein Ergebnis gefunden zu haben, aber tatsächlich eines vorliegt, werden genannt Fehler zweiter Art.

Diese Fehler entstehen, weil die Möglichkeit einer fehlerhaften statistischen Auswertung nicht ausgeschlossen werden kann. Die Irrtumswahrscheinlichkeit hängt von der statistischen Signifikanz der Ergebnisse ab. Wir haben bereits angemerkt, dass das Signifikanzniveau unter 0,05 liegen muss, damit das Ergebnis als korrekt angesehen wird. Natürlich sind einige Ergebnisse mehr niedriges Niveau, und es ist nicht ungewöhnlich, dass Ergebnisse von nur 0,001 angezeigt werden (ein Wert von 0,001 bedeutet, dass die Wahrscheinlichkeit, dass die Ergebnisse falsch sind, bei 1 zu 1000 liegt). Wie weniger Wert p, desto stärker ist unser Vertrauen in die Richtigkeit der Ergebnisse.

Im Tisch. 7.2 zeigt die traditionelle Interpretation von Signifikanzniveaus über die Möglichkeit des statistischen Rückschlusses und die Begründung der Entscheidung über das Vorliegen eines Zusammenhangs (Unterschiede).

Tabelle 7.2

Traditionelle Interpretation von Signifikanzniveaus in der Psychologie

Basierend auf den Erfahrungen der praktischen Forschung wird empfohlen, zur Vermeidung von Fehlern der ersten und zweiten Art bei verantwortlichen Schlussfolgerungen Entscheidungen über das Vorhandensein von Unterschieden (Verbindungen) zu treffen und sich dabei auf die Ebene zu konzentrieren R n-Zeichen.

Statistischer Test(Statistischer Test - es ist ein Werkzeug zur Bestimmung des statistischen Signifikanzniveaus. Dies ist eine Entscheidungsregel, die sicherstellt, dass eine wahre Hypothese akzeptiert und eine falsche mit hoher Wahrscheinlichkeit verworfen wird.

Statistische Kriterien bezeichnen auch die Methode zur Berechnung einer bestimmten Zahl und die Zahl selbst. Alle Kriterien werden mit einem Hauptziel verwendet: zu bestimmen Signifikanzniveau die Daten, die sie analysieren (d. h. die Wahrscheinlichkeit, dass die Daten den wahren Effekt widerspiegeln, der die Grundgesamtheit, aus der die Stichprobe gezogen wurde, korrekt darstellt).

Einige Kriterien können nur für normalverteilte Daten verwendet werden (und wenn das Merkmal auf einer Intervallskala gemessen wird) - diese Kriterien werden normalerweise aufgerufen parametrisch. Mit Hilfe weiterer Kriterien können Sie Daten mit nahezu jedem Verteilungsgesetz analysieren – so heißen sie nichtparametrisch.

Parametrische Kriterien – Kriterien, die Verteilungsparameter in der Berechnungsformel enthalten, d. h. Mittelwerte und Varianzen (Student's t-Test, Fisher's F-Test usw.).

Nichtparametrische Kriterien - Kriterien, die keine Verteilungsparameter in die Formel zur Berechnung der Verteilungen einbeziehen und auf Betriebshäufigkeiten oder Rängen basieren (Kriterium Q Rosenbaum, Kriterium U Manna - Whitney

Wenn wir zum Beispiel sagen, dass die Signifikanz von Unterschieden durch den Student-t-Test bestimmt wurde, meinen wir, dass die Methode des Student-t-Tests verwendet wurde, um den empirischen Wert zu berechnen, der dann mit dem tabellarischen (kritischen) Wert verglichen wird.

Nach dem Verhältnis der empirischen (von uns berechneten) und kritischen Werte des Kriteriums (Tabelle) können wir beurteilen, ob unsere Hypothese bestätigt oder widerlegt ist. Damit wir die Unterschiede als signifikant erkennen, ist es in den meisten Fällen notwendig, dass der Erfahrungswert des Kriteriums den kritischen überschreitet, obwohl es Kriterien gibt (z. B. den Mann-Whitney-Test oder den Vorzeichentest), bei denen dies der Fall ist wir müssen uns an die gegenteilige Regel halten.

In einigen Fällen enthält die Berechnungsformel des Kriteriums die Anzahl der Beobachtungen in der Untersuchungsstichprobe, bezeichnet als P. Anhand einer speziellen Tabelle ermitteln wir, welcher Grad an statistischer Signifikanz von Unterschieden einem gegebenen Erfahrungswert entspricht. In den meisten Fällen kann derselbe Erfahrungswert des Kriteriums signifikant oder insignifikant ausfallen, je nach Anzahl der Beobachtungen in der Untersuchungsstichprobe ( P ) oder aus dem sog Anzahl der Freiheitsgrade , was als bezeichnet wird v (g>) oder beides df (Manchmal D).

Wissen P oder die Anzahl der Freiheitsgrade können wir spezielle Tabellen verwenden (die wichtigsten sind in Anhang 5 angegeben), um die kritischen Werte des Kriteriums zu bestimmen und den erhaltenen Erfahrungswert mit ihnen zu vergleichen. Normalerweise wird es so geschrieben: n = 22 kritische Werte des Kriteriums sind tSt = 2.07" oder "at v (D) = 2, die kritischen Werte des Student-Kriteriums sind = 4,30 "und die sog.

Üblicherweise werden jedoch parametrische Kriterien bevorzugt, und an dieser Position halten wir fest. Sie gelten als zuverlässiger und können mehr Informationen und tiefere Analysen liefern. Bezüglich der Komplexität mathematischer Berechnungen bei der Verwendung Computerprogramme diese Schwierigkeit verschwindet (aber einige andere scheinen jedoch ziemlich überwindbar zu sein).

  • In diesem Lehrbuch gehen wir nicht näher auf das Problem der Statistik ein
  • Hypothesen (Null - R0 und Alternative - Hj) und statistische Entscheidungen, da Psychologiestudenten dies separat im Fach "Mathematische Methoden der Psychologie" studieren. Außerdem ist zu beachten, dass bei der Erstellung eines Forschungsberichts (Lehrveranstaltung bzw These, Veröffentlichungen) statistische Hypothesen und statistische Lösungen werden in der Regel nicht angegeben. Normalerweise wird bei der Beschreibung der Ergebnisse ein Kriterium angegeben, die erforderlichen beschreibenden Statistiken (Mittelwerte, Sigma, Korrelationskoeffizienten usw.), Erfahrungswerte der Kriterien, Freiheitsgrade und notwendigerweise das p-Signifikanzniveau angegeben. Dann wird eine sinnvolle Schlussfolgerung in Bezug auf die zu testende Hypothese formuliert, die (normalerweise in Form von Ungleichheit) das erreichte oder nicht erreichte Signifikanzniveau angibt.

Statistische Gültigkeit ist in der Berechnungspraxis der FCC von wesentlicher Bedeutung. Es wurde bereits erwähnt, dass viele Stichproben aus derselben Grundgesamtheit ausgewählt werden können:

Wenn sie richtig ausgewählt werden, unterscheiden sich ihre durchschnittlichen Indikatoren und Indikatoren der allgemeinen Bevölkerung unter Berücksichtigung der akzeptierten Zuverlässigkeit in der Größe des Repräsentativitätsfehlers geringfügig voneinander.

Wenn sie aus verschiedenen Allgemeinpopulationen ausgewählt werden, erweist sich der Unterschied zwischen ihnen als signifikant. Der Vergleich von Stichproben wird üblicherweise in der Statistik berücksichtigt;

Wenn sie sich geringfügig, unbedeutend, unbedeutend unterscheiden, also tatsächlich derselben Grundgesamtheit angehören, wird der Unterschied zwischen ihnen als statistisch unzuverlässig bezeichnet.

statistisch signifikant ein Stichprobenunterschied ist eine Stichprobe, die sich signifikant und grundlegend unterscheidet, d. h. zu unterschiedlichen Grundgesamtheiten gehört.

In der FCC bedeutet die Bewertung der statistischen Signifikanz von Stichprobenunterschieden die Lösung vieler praktischer Probleme. Beispielsweise ist die Einführung neuer Lehrmethoden, Programme, Übungssätze, Tests, Kontrollübungen mit deren experimenteller Überprüfung verbunden, die zeigen soll, dass sich die Testgruppe grundlegend von der Kontrollgruppe unterscheidet. Daher werden spezielle statistische Methoden verwendet, die als statistische Signifikanzkriterien bezeichnet werden, um das Vorhandensein oder Nichtvorhandensein eines statistisch signifikanten Unterschieds zwischen Stichproben festzustellen.

Alle Kriterien sind in zwei Gruppen unterteilt: parametrisch und nichtparametrisch. Parametrische Kriterien sehen das zwingende Vorhandensein eines Normalverteilungsgesetzes vor, d.h. dies bezieht sich auf die verpflichtende Bestimmung der Hauptkennzahlen des Normalrechts - des arithmetischen Mittels und der Standardabweichung s. Parametrische Kriterien sind die genauesten und korrekten. Nichtparametrische Kriterien basieren auf Rangunterschieden (Ordnungsdifferenzen) zwischen den Elementen der Stichproben.

Hier sind die Hauptkriterien für die statistische Signifikanz, die in der Praxis der FCC verwendet werden: Student's Test und Fisher's Test.

Schülerkriterium benannt nach dem englischen Wissenschaftler C. Gosset (Student ist ein Pseudonym), der diese Methode entdeckt hat. Der Student's t-Test ist parametrisch und wird zum Vergleich verwendet absolute Indikatoren Proben. Proben können in der Größe variieren.

Schülerkriterium ist so definiert.

1. Wir finden das Student-Kriterium t nach folgender Formel:


wo sind die arithmetischen Mittel der verglichenen Proben; t 1 , t 2 - Repräsentativitätsfehler, die auf der Grundlage der Indikatoren der verglichenen Stichproben identifiziert wurden.

2. Die Praxis in der FCC hat gezeigt, dass es für die Sportarbeit ausreicht, die Zuverlässigkeit der Punktzahl P = 0,95 zu akzeptieren.

Für die Berechnungssicherheit: P = 0,95 (a = 0,05), mit der Anzahl der Freiheitsgrade

k \u003d n 1 + p 2 - 2 Gemäß der Tabelle in Anhang 4 finden wir den Wert des Grenzwerts des Kriteriums ( t gr).

3. Basierend auf den Eigenschaften des Normalverteilungsgesetzes vergleicht das Student-Kriterium t und tgr.

Wir ziehen Schlussfolgerungen:

wenn t t gr, dann ist der Unterschied zwischen den verglichenen Stichproben statistisch signifikant;

wenn t t gr, dann ist der Unterschied statistisch nicht signifikant.

Für Forscher im Bereich FCC ist die Bewertung der statistischen Signifikanz der erste Schritt zur Lösung eines konkreten Problems: ob sich die verglichenen Stichproben grundlegend unterscheiden oder nicht. Der nächste Schritt besteht darin, diesen Unterschied aus pädagogischer Sicht zu bewerten, die von der Situation des Problems bestimmt wird.

Betrachten Sie die Anwendung des Schülerkriteriums auf ein bestimmtes Beispiel.

Beispiel 2.14. Eine Gruppe von Probanden in der Menge von 18 Personen wurde auf Herzfrequenz (bpm) vor x i und danach untersucht y ich Aufwärmen.

Bewerten Sie die Effektivität des Aufwärmens in Bezug auf die Herzfrequenz. Die Anfangsdaten und Berechnungen sind in der Tabelle dargestellt. 2.30 und 2.31.

Tabelle 2.30

Verarbeitung von Herzfrequenzdaten vor dem Aufwärmen


Die Fehler für beide Gruppen stimmten überein, da die Stichprobenumfänge gleich sind (dieselbe Gruppe wird unter verschiedenen Bedingungen untersucht) und die Standardabweichungen s x = s y = 3 bpm waren. Kommen wir zur Definition des Student-Kriteriums:

Wir setzen die Zuverlässigkeit des Kontos: Р= 0,95.

Die Anzahl der Freiheitsgrade k 1 \u003d n 1 + p 2 - 2 \u003d 18 + 18-2 \u003d 34. Gemäß der Tabelle in Anhang 4 finden wir t gr= 2,02.

Statistische Inferenz. Da t \u003d 11,62 und die Grenze t gr \u003d 2,02, dann 11,62\u003e 2,02, d.h. t > tgr, also ist der Unterschied zwischen den Stichproben statistisch signifikant.

Pädagogischer Abschluss. Es wurde festgestellt, dass in Bezug auf die Herzfrequenz der Unterschied zwischen dem Zustand der Gruppe vor und nach dem Aufwärmen statistisch signifikant ist, d.h. bedeutend, wichtig. Anhand der Herzfrequenzanzeige können wir also schlussfolgern, dass das Aufwärmen effektiv ist.

Fishers Kriterium ist parametrisch. Es wird verwendet, wenn die Streuraten von Proben verglichen werden. Dies bedeutet in der Regel einen Vergleich in Bezug auf die Stabilität der sportlichen Arbeit oder die Stabilität funktionaler und technischer Indikatoren in der Praxis. Bewegungserziehung, Körpererziehung, Leibeserziehung und Sport. Proben können unterschiedliche Größen haben.

Das Fisher-Kriterium wird in der folgenden Sequenz definiert.

1. Ermitteln Sie das Fisher-Kriterium F anhand der Formel


wobei , die Varianzen der verglichenen Stichproben sind.

Die Bedingungen des Fisher-Kriteriums liefern dies im Zähler der Formel F Es gibt eine große Varianz, d.h. F ist immer größer als eins.

Wir legen die Zuverlässigkeit des Kontos fest: P = 0,95 - und bestimmen die Anzahl der Freiheitsgrade für beide Stichproben: k 1 = n 1 - 1, k 2 = n 2 - 1.

Gemäß der Tabelle in Anhang 4 finden wir den Grenzwert des Kriteriums F GR.

Vergleich der Kriterien F und F GR lässt uns folgende Schlussfolgerungen ziehen:

wenn F > Fgr, dann ist der Unterschied zwischen den Proben statistisch signifikant;

wenn f< F гр, то различие между выборками статически недо­стоверно.

Nehmen wir ein konkretes Beispiel.

Beispiel 2.15. Analysieren wir zwei Gruppen von Handballspielern: x ich (n 1= 16 Personen) und y i (n 2 = 18 Personen). Diese Sportlergruppen wurden auf die Abstoßzeit(en) beim Werfen des Balls ins Tor untersucht.

Sind die Abstoßungsraten gleich?

Anfangsdaten und grundlegende Berechnungen sind in der Tabelle dargestellt. 2.32 und 2.33.

Tabelle 2.32

Verarbeitung von Abstoßungsindikatoren der ersten Handballergruppe


Lassen Sie uns das Fisher-Kriterium definieren:





Gemäß den in der Tabelle von Anhang 6 präsentierten Daten finden wir Fgr: Fgr = 2,4

Beachten wir, dass in der Tabelle des Anhangs 6 die Aufzählung der Anzahl der Freiheitsgrade sowohl größerer als auch geringerer Streuung bei Annäherung an große Zahlen gröber wird. Die Anzahl der Freiheitsgrade einer größeren Dispersion folgt also in dieser Reihenfolge: 8, 9, 10, 11, 12, 14, 16, 20, 24 usw. und einer kleineren - 28, 29, 30, 40, 50 usw. d.

Dies erklärt sich dadurch, dass mit zunehmendem Stichprobenumfang die Unterschiede im F-Test abnehmen und Tabellenwerte, die nahe an den Originaldaten liegen, verwendet werden können. In Beispiel 2.15 fehlt also =17 und wir können den nächstliegenden Wert k = 16 nehmen, woraus wir Fgr = 2.4 erhalten.

Statistische Inferenz. Da der Fisher-Test F = 2,5 > F = 2,4 ist, sind die Stichproben statistisch signifikant.

Pädagogischer Abschluss. Die Werte der Abstoßzeit(en) beim Einwurf des Balles ins Tor der Handballer beider Gruppen unterscheiden sich deutlich. Diese Gruppen sollten als unterschiedlich betrachtet werden.

Weitere Untersuchungen sollten zeigen, was der Grund für diesen Unterschied ist.

Beispiel 2.20.(über die statistische Signifikanz der Stichprobe ). Hat sich die Qualifikation des Fußballspielers erhöht, wenn die Zeit(en) von der Signalgabe bis zum Treten des Balls zu Beginn des Trainings x i und am Ende i war.

Die Anfangsdaten und Grundberechnungen sind in der Tabelle angegeben. 2.40 und 2.41.

Tabelle 2.40

Verarbeitung von Zeitindikatoren vom Signalgeben bis zum Schlagen des Balls zu Beginn eines Trainings


Lassen Sie uns den Unterschied zwischen Gruppen von Indikatoren nach dem Student-Kriterium bestimmen:

Mit Zuverlässigkeit P \u003d 0,95 und Freiheitsgraden k \u003d n 1 + n 2 - 2 \u003d 22 + 22 - 2 \u003d 42 finden wir gemäß der Tabelle in Anhang 4 t gr= 2,02. Da t = 8,3 > t gr= 2,02 - der Unterschied ist statistisch signifikant.

Bestimmen wir den Unterschied zwischen den Indikatorengruppen nach dem Fisher-Kriterium:


Gemäß der Tabelle in Anhang 2 ist bei Zuverlässigkeit P = 0,95 und Freiheitsgraden k = 22-1 = 21 der Wert von F gr = 21. Da F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Statistische Inferenz. Nach dem arithmetischen Mittel ist der Unterschied zwischen den Indikatorengruppen statistisch signifikant. Hinsichtlich der Streuung (Streuung) ist der Unterschied zwischen den Indikatorengruppen statistisch nicht signifikant.

Pädagogischer Abschluss. Die Qualifikation des Fußballers hat sich deutlich verbessert, aber die Stabilität seiner Aussage sollte beachtet werden.

Vorbereitung auf die Arbeit

Vor dem Labor arbeit in der Disziplin "Sportmesstechnik" an alle Schüler Studiengruppe es ist notwendig, Arbeitsgruppen von jeweils 3-4 Studierenden zu bilden, den Arbeitsauftrag aller Laborarbeiten gemeinsam zu erledigen.

In Vorbereitung auf die Arbeit Machen Sie sich mit den relevanten Abschnitten der empfohlenen Literatur (siehe Abschnitt 6 dieser Richtlinien) und Vorlesungsunterlagen vertraut. Studieren Sie die Abschnitte 1 und 2 für dieses Praktikum sowie die Arbeitsaufgabe dafür (Abschnitt 4).

Bereiten Sie ein Berichtsformular vor auf Standardblätter A4-Briefpapier und legen Sie die für die Arbeit erforderlichen Materialien hinein.

Der Bericht muss enthalten :

Titelblatt unter Angabe des Fachbereichs (UK und TR), der Studiengruppe, des Nachnamens, des Vornamens, des Vatersnamens des Studierenden, der Nummer und des Namens der Laborarbeit, des Datums ihrer Fertigstellung sowie des Nachnamens, akademischen Grades, akademischen Titels und der Position der Lehrer, der die Arbeit annimmt;

Ziel der Arbeit;

Formeln mit Zahlenwerten, die die Zwischen- und Endergebnisse von Berechnungen erklären;

Tabellen gemessener und berechneter Werte;

Erforderliches Bildmaterial für die Aufgabe;

Kurze Schlussfolgerungen nach den Ergebnissen der einzelnen Phasen der Arbeitsaufgabe und im Allgemeinen nach der durchgeführten Arbeit.

Alle Grafiken und Tabellen werden mit Zeichenwerkzeugen genau gezeichnet. Bedingte grafische und alphabetische Bezeichnungen müssen GOSTs entsprechen. Es ist erlaubt, einen Bericht unter Verwendung von Computer-(Computer-)Technologie zu erstellen.

Arbeitsaufgabe

Vor der Durchführung aller Messungen muss jedes Teammitglied die Regeln für die Verwendung des Sportspiels Darts in Anhang 7 studieren, die für die Durchführung der folgenden Forschungsphasen erforderlich sind.

I - te Phase der Forschung„Die Untersuchung der Ergebnisse des Treffens des Ziels des Sportspiels Darts durch jedes Mitglied der Brigade für die Einhaltung des normalen Verteilungsgesetzes gemäß dem Kriterium x 2 Pearson und der Drei-Sigma-Test“

1. messen (testen) Sie Ihre (persönliche) Schnelligkeit und Handlungskoordination, durch 30- bis 40-maliges Werfen von Dartpfeilen auf die kreisförmige Zielscheibe des Sportspiels Darts.

2. Messergebnisse (Tests) x ich(in Punkten) in Form einer Variationsreihe anordnen und in Tabelle 4.1 (Spalten) eintragen, alle notwendigen Berechnungen durchführen, die notwendigen Tabellen ausfüllen und die entsprechenden Schlussfolgerungen über die Übereinstimmung der erhaltenen empirischen Verteilung mit dem Normalverteilungsgesetz ziehen, in Analogie zu ähnlichen Berechnungen, Tabellen und Schlussfolgerungen von Beispiel 2.12, die in Abschnitt 2 dieser Richtlinie auf den Seiten 7-10 angegeben sind.

Tabelle 4.1

Entsprechung der Geschwindigkeit und Koordination der Handlungen der Subjekte mit dem normalen Verteilungsgesetz

Nr. p / p gerundet
Gesamt

II - Stufe der Forschung

"Bewertung der durchschnittlichen Indikatoren der Gesamtbevölkerung von Treffern auf das Ziel des Sportspiels Darts aller Schüler der Bildungsgruppe basierend auf den Ergebnissen von Messungen von Mitgliedern einer Brigade"

Bewerten Sie die durchschnittlichen Indikatoren für die Geschwindigkeit und Koordination der Aktionen aller Schüler der Lerngruppe (gemäß der Liste der Lerngruppe der Klassenzeitschrift) basierend auf den Ergebnissen des Treffens des Ziels des Sportspiels Darts durch alle Mitglieder der Team, das in der ersten Phase der Forschung in dieser Laborarbeit erhalten wurde.

1. Dokumentieren Sie die Ergebnisse von Geschwindigkeitsmessungen und Koordination von Aktionen beim Werfen von Dartpfeilen auf eine kreisförmige Zielscheibe des Sportspiels Darts aller Mitglieder Ihres Teams (2 - 4 Personen), die eine Auswahl von Messergebnissen aus der Allgemeinbevölkerung sind (Messergebnisse aller Studierenden der Studiengruppe - z. 15 Personen), Eintragung in die zweite und dritte Spalte Tabelle 4.2.

Tabelle 4.2

Verarbeitung von Geschwindigkeitsindikatoren und Koordination von Aktionen

Brigademitglieder

Nr. p / p
Gesamt

Tabelle 4.2 unten sollte verstanden werden , übereinstimmende Durchschnittsnote (siehe Berechnungsergebnisse nach Tabelle 4.1) Mitglieder Ihres Teams , in der ersten Phase der Forschung erhalten. Es ist darauf hinzuweisen, dass, allgemein, in Tabelle 4.2 ist ein berechneter Mittelwert der Messergebnisse aufgeführt, die von einem Mitglied des Teams in der ersten Phase der Untersuchung erzielt wurden , da die Wahrscheinlichkeit, dass die Messergebnisse verschiedener Teammitglieder übereinstimmen, sehr gering ist. Dann, normalerweise Werte in einer Spalte Tabellen 4.2 für jede der Zeilen - sind gleich 1, A in der Zeile „Gesamt » Spalten « », geschrieben wird die Anzahl der Mitglieder Ihres Teams.

2. Führen Sie alle notwendigen Berechnungen durch, um Tabelle 4.2 auszufüllen, sowie andere Berechnungen und Schlussfolgerungen ähnlich den Berechnungen und Schlussfolgerungen von Beispiel 2.13, die im 2. Abschnitt dieses Dokuments angegeben sind methodische Entwicklung auf den Seiten 13-14. Dies sollte bei der Berechnung des Repräsentativitätsfehlers berücksichtigt werden "M" Es ist notwendig, Formel 2.4 zu verwenden, die auf Seite 13 dieser methodischen Entwicklung angegeben ist, da die Stichprobe klein ist (n, und die Anzahl der Elemente der Allgemeinbevölkerung N bekannt ist und gleich der Anzahl der Studenten in der Studiengruppe ist , gemäß der Liste der Zeitschrift der Studiengruppe.

III - Stufe der Forschung

Bewertung der Wirksamkeit des Aufwärmens in Bezug auf "Geschwindigkeit und Koordination der Aktionen" durch jedes Teammitglied anhand des Student-Kriteriums

Um die Wirksamkeit des Aufwärmens zum Werfen von Darts auf das Ziel des Sportspiels "Darts" zu bewerten, das in der ersten Phase der Forschung dieser Laborarbeit von jedem Mitglied des Teams in Bezug auf "Geschwindigkeit und Koordination von Aktionen", unter Verwendung des Student-Kriteriums - ein parametrisches Kriterium der statistischen Zuverlässigkeit des empirischen Verteilungsgesetzes zum normalen Verteilungsgesetz.

… Gesamt

2. Streuung und Nordkasachstan , die Ergebnisse der Messungen des Indikators "Geschwindigkeit und Koordination von Aktionen" basierend auf den Ergebnissen des Aufwärmens, in Tabelle 4.3 angegeben, (siehe ähnliche Berechnungen unmittelbar nach Tabelle 2.30 von Beispiel 2.14 auf Seite 16 dieser methodologischen Entwicklung).

3. Jedes Mitglied des Arbeitsteams messen (testen) Sie Ihre (persönliche) Schnelligkeit und Handlungskoordination nach dem Aufwärmen,

… Gesamt

5. Führen Sie Durchschnittsberechnungen durch Streuung und Nordkasachstan ,die Ergebnisse der Messungen des Indikators "Geschwindigkeit und Koordination von Aktionen" nach dem Aufwärmen, in Tabelle 4.4 angegeben, Schreiben Sie das Gesamtergebnis der Messungen auf der Grundlage der Ergebnisse des Aufwärmens auf (siehe ähnliche Berechnungen unmittelbar nach Tabelle 2.31 von Beispiel 2.14 auf Seite 17 dieser methodologischen Entwicklung).

6. Führen Sie alle notwendigen Berechnungen und Schlussfolgerungen durch, ähnlich den Berechnungen und Schlussfolgerungen von Beispiel 2.14, die im 2. Abschnitt dieser methodischen Entwicklung auf den Seiten 16-17 angegeben sind. Dies sollte bei der Berechnung des Repräsentativitätsfehlers berücksichtigt werden "M" Es ist notwendig, Formel 2.1 zu verwenden, die auf Seite 12 dieser methodischen Entwicklung angegeben ist, da die Stichprobe n ist und die Anzahl der Elemente der Grundgesamtheit N ( unbekannt ist.

IV - Stufe der Forschung

Bewertung der Einheitlichkeit (Stabilität) der Indikatoren "Geschwindigkeit und Koordination von Aktionen" von zwei Teammitgliedern anhand des Fisher-Kriteriums

Bewerten Sie die Einheitlichkeit (Stabilität) der Indikatoren "Geschwindigkeit und Koordination der Aktionen" von zwei Teammitgliedern anhand des Fisher-Kriteriums gemäß den Messergebnissen, die in der dritten Phase der Forschung dieser Laborarbeit erhalten wurden.

Gehen Sie dazu wie folgt vor.

Unter Verwendung der Daten der Tabellen 4.3 und 4.4, der Ergebnisse der Berechnung der Streuungen für diese Tabellen, die in der dritten Forschungsphase erhalten wurden, sowie der Methodik zur Berechnung und Anwendung des Fisher-Kriteriums zur Bewertung der Einheitlichkeit (Stabilität) von Sportindikatoren, die in Beispiel 2.15 auf den Seiten 18-19 dieser methodologischen Entwicklung gegeben sind, geeignete statistische und pädagogische Schlussfolgerungen ziehen.

V - Stufe der Forschung

Bewertung der Indikatorengruppen "Geschwindigkeit und Koordination der Aktionen" eines Teammitglieds vor und nach dem Aufwärmen

KOSTENPFLICHTIGE FUNKTION. Die statistische Signifikanzfunktion ist nur in einigen verfügbar Tarifpläne. Überprüfen Sie, ob es drin ist.

Sie können herausfinden, ob es statistisch signifikante Unterschiede in den erhaltenen Antworten gibt verschiedene Gruppen Antworten auf Fragen in der Umfrage. Um mit der statistischen Signifikanzfunktion in SurveyMonkey zu arbeiten, müssen Sie:

  • Aktivieren Sie die statistische Signifikanzfunktion, wenn Sie einer Frage in Ihrer Umfrage eine Vergleichsregel hinzufügen. Wählen Sie Vergleichsgruppen, um Umfrageergebnisse zum einfachen Vergleich in Gruppen zu sortieren.
  • Untersuchen Sie die Tabellen mit Daten zu Ihren Umfragefragen, um das Vorhandensein von statistisch zu identifizieren deutliche Unterschiede in den Antworten, die von verschiedenen Gruppen von Befragten erhalten wurden.

Anzeigen der statistischen Signifikanz

Indem Sie die folgenden Schritte ausführen, können Sie eine Umfrage erstellen, die statistische Signifikanz aufweist.

1. Fügen Sie Ihrer Umfrage geschlossene Fragen hinzu

Um bei der Analyse der Ergebnisse statistische Signifikanz anzuzeigen, müssen Sie eine Vergleichsregel auf jede Frage aus Ihrer Umfrage anwenden.

Sie können eine Vergleichsregel anwenden und die statistische Signifikanz der Antworten berechnen, wenn Sie eine der folgenden Methoden in Ihrem Umfragedesign verwenden. die folgenden Arten Fragen:

Es ist darauf zu achten, dass die vorgeschlagenen Antwortmöglichkeiten in vollwertige Gruppen eingeteilt werden können. Die Antwortoptionen, die Sie beim Erstellen einer Vergleichsregel für den Vergleich auswählen, werden verwendet, um Ihre Daten in der gesamten Umfrage mit Kreuztabellen zu vergleichen.

2. Sammeln Sie Antworten

Nachdem Sie Ihre Umfrage abgeschlossen haben, erstellen Sie einen Collector, um sie zu verteilen. Es gibt mehrere Möglichkeiten.

Sie müssen mindestens 30 Antworten für jede Antwortoption erhalten, die Sie in Ihrer Vergleichsregel verwenden möchten, um die statistische Signifikanz zu aktivieren und anzuzeigen.

Umfragebeispiel

Sie möchten wissen, ob Männer signifikant zufriedener mit Ihren Produkten sind als Frauen.

  1. Fügen Sie Ihrer Umfrage zwei Multiple-Choice-Fragen hinzu:
    Was ist dein Geschlecht? (Männlich weiblich)
    Sind Sie mit unserem Produkt zufrieden oder unzufrieden? (zufrieden (-flachs), unzufrieden (-flachs))
  2. Stellen Sie sicher, dass mindestens 30 Befragte „männlich“ als Geschlechtsfrage auswählen, UND AUCH mindestens 30 Befragte „weiblich“ als ihr Geschlecht auswählen.
  3. Fügen Sie der Frage "Was ist Ihr Geschlecht?" eine Vergleichsregel hinzu. und wählen Sie beide Antworten als Ihre Gruppen aus.
  4. Verwenden Sie das Datenblatt unter der Fragentabelle "Sind Sie mit unserem Produkt zufrieden oder unzufrieden?" um zu sehen, ob eine der Antwortmöglichkeiten einen statistisch signifikanten Unterschied aufweist

Was ist ein statistisch signifikanter Unterschied?

Ein statistisch signifikanter Unterschied bedeutet, dass bei statistischer Analyse signifikante Unterschiede zwischen den Antworten einer Gruppe von Befragten und den Antworten einer anderen Gruppe bestehen. Statistische Signifikanz bedeutet, dass die erhaltenen Zahlen signifikant unterschiedlich sind. Dieses Wissen wird Ihnen bei der Datenanalyse sehr helfen. Die Bedeutung der erzielten Ergebnisse wird jedoch von Ihnen bestimmt. Sie entscheiden, wie Sie die Ergebnisse der Umfragen interpretieren und welche Maßnahmen darauf basierend ergriffen werden sollen.

Beispielsweise erhalten Sie mehr Anfragen von weiblichen Käufern als von männlichen Käufern. Wie kann festgestellt werden, ob ein solcher Unterschied real ist und ob diesbezüglich Maßnahmen erforderlich sind? Eine gute Möglichkeit, Ihre Beobachtungen zu testen, ist die Durchführung einer Umfrage, die Ihnen zeigt, ob männliche Kunden signifikant zufriedener mit Ihrem Produkt sind oder nicht. Mit Hilfe einer statistischen Formel können Sie mit unserer vorgeschlagenen statistischen Signifikanzfunktion feststellen, ob Ihr Produkt Männern wirklich viel mehr gefällt als Frauen. Auf diese Weise können Sie auf der Grundlage von Fakten handeln, nicht auf Vermutungen.

Statistisch signifikanter Unterschied

Wenn Ihre Ergebnisse in der Datentabelle hervorgehoben sind, bedeutet dies, dass sich die beiden Befragtengruppen signifikant voneinander unterscheiden. Der Begriff „erheblich“ bedeutet nicht, dass die ermittelten Zahlen von besonderer Bedeutung oder Aussagekraft sind, sondern nur, dass zwischen ihnen ein statistischer Unterschied besteht.

Kein statistisch signifikanter Unterschied

Wenn Ihre Ergebnisse in der entsprechenden Datentabelle nicht hervorgehoben sind, bedeutet dies, dass trotz des möglichen Unterschieds zwischen den beiden verglichenen Zahlen kein statistischer Unterschied zwischen ihnen besteht.

Antworten ohne statistisch signifikante Unterschiede zeigen, dass es bei der von Ihnen verwendeten Stichprobengröße keinen signifikanten Unterschied zwischen den beiden verglichenen Items gibt, aber das bedeutet nicht zwangsläufig, dass sie keine Rolle spielen. Vielleicht können Sie durch Erhöhen der Stichprobengröße einen statistisch signifikanten Unterschied feststellen.

Stichprobengröße

Wenn Sie eine sehr kleine Stichprobengröße haben, sind nur sehr wenige signifikant. große Unterschiede zwischen zwei Gruppen. Wenn Sie einen sehr großen Stichprobenumfang haben, werden sowohl kleine als auch große Unterschiede als signifikant gezählt.

Wenn jedoch zwei Zahlen statistisch unterschiedlich sind, bedeutet dies nicht, dass der Unterschied zwischen den Ergebnissen für Sie von praktischer Bedeutung ist. Welche Unterschiede für Ihre Befragung signifikant sind, müssen Sie selbst entscheiden.

Berechnung der statistischen Signifikanz

Wir berechnen die statistische Signifikanz unter Verwendung des Standard-Konfidenzniveaus von 95 %. Wenn eine Antwortoption als statistisch signifikant angezeigt wird, bedeutet dies, dass eine Wahrscheinlichkeit von weniger als 5 % besteht, dass ein Unterschied zwischen den beiden Gruppen allein auf Zufall oder Stichprobenfehler zurückzuführen ist (häufig dargestellt als: S<0,05).

Um statistisch signifikante Unterschiede zwischen Gruppen zu berechnen, verwenden wir die folgenden Formeln:

Parameter

Beschreibung

a1Der Anteil der Teilnehmer aus der ersten Gruppe, die die Frage auf eine bestimmte Weise beantwortet haben, multipliziert mit der Stichprobengröße dieser Gruppe.
b1Der Anteil der Teilnehmer aus der zweiten Gruppe, die die Frage auf eine bestimmte Weise beantwortet haben, multipliziert mit der Stichprobengröße dieser Gruppe.
Konsolidierter Stichprobenanteil (p)Die Summe von zwei Anteilen aus beiden Gruppen.
Standardfehler (SE)Ein Maß dafür, wie stark Ihr Anteil von Ihrem tatsächlichen Anteil abweicht. Ein kleinerer Wert bedeutet, dass der Anteil nahe am tatsächlichen Anteil liegt, ein größerer Wert bedeutet, dass der Anteil deutlich vom tatsächlichen Anteil abweicht.
Teststatistik (t)Teststatistik. Die Anzahl der Standardabweichungswerte, um die sich dieser Wert vom Mittelwert unterscheidet.
Statistische SignifikanzWenn der Absolutwert der Teststatistik 1,96* Standardabweichungen vom Mittelwert überschreitet, wird dies als statistisch signifikanter Unterschied betrachtet.

*1,96 ist der Wert, der für das Konfidenzniveau von 95 % verwendet wird, da 95 % des vom Student-t-Test verarbeiteten Bereichs innerhalb von 1,96 Standardabweichungen vom Mittelwert liegen.

Rechenbeispiel

Lassen Sie uns in Fortsetzung des oben verwendeten Beispiels herausfinden, ob der Prozentsatz der Männer, die sagen, dass sie mit Ihrem Produkt zufrieden sind, tatsächlich signifikant höher ist als der Prozentsatz der Frauen.

Nehmen wir an, 1.000 Männer und 1.000 Frauen haben an Ihrer Umfrage teilgenommen, und als Ergebnis der Umfrage hat sich herausgestellt, dass 70 % der Männer und 65 % der Frauen sagen, dass sie mit Ihrem Produkt zufrieden sind. Ist die Punktzahl bei 70 % signifikant höher als die Punktzahl bei 65 %?

Setzen Sie die folgenden Daten aus der Umfrage in die vorgeschlagenen Formeln ein:

  • p1 (% der Männer, die mit dem Produkt zufrieden sind) = 0,7
  • p2 (% der Frauen, die mit dem Produkt zufrieden sind) = 0,65
  • n1 (Anzahl der befragten Männer) = 1000
  • n2 (Anzahl der befragten Frauen) = 1000

Da der Absolutwert der Teststatistik größer als 1,96 ist, bedeutet dies, dass der Unterschied zwischen Männern und Frauen signifikant ist. Im Vergleich zu Frauen sind Männer eher mit Ihrem Produkt zufrieden.

Statistische Signifikanz verbergen

So verbergen Sie die statistische Signifikanz für alle Fragen

  1. Klicken Sie auf den Abwärtspfeil rechts neben der Vergleichsregel in der linken Seitenleiste.
  2. Wählen Sie einen Artikel aus Regel bearbeiten.
  3. Funktion deaktivieren Statistische Signifikanz zeigen mit dem Schalter.
  4. Drück den Knopf Anwenden.

Um die statistische Signifikanz für eine einzelne Frage auszublenden, müssen Sie:

  1. Drück den Knopf Melodieüber dem Fragendiagramm.
  2. Öffnen Sie eine Registerkarte Anzeigeoptionen.
  3. Deaktivieren Sie das Kontrollkästchen neben Statistische Signifikanz.
  4. Drück den Knopf Speichern.

Die Anzeigeoption wird automatisch aktiviert, wenn die Anzeige der statistischen Signifikanz aktiviert ist. Wenn Sie diese Anzeigeoption deaktivieren, wird auch die Anzeige der statistischen Signifikanz deaktiviert.

Aktivieren Sie die Funktion „Statistische Signifikanz“, wenn Sie einer Frage in Ihrer Umfrage eine Vergleichsregel hinzufügen. Untersuchen Sie die Datentabellen für Ihre Umfragefragen, um statistisch signifikante Unterschiede in den Antworten zu identifizieren, die Sie von verschiedenen Gruppen von Befragten erhalten.