Aufgabe 3. Fünf Vorschulkinder werden einem Test unterzogen. Die Zeit für die Lösung jeder Aufgabe ist festgelegt. Wird es statistisch signifikante Unterschiede zwischen der Zeit zum Lösen der ersten drei Aufgaben des Tests geben?

Anzahl der Fächer

Referenzmaterial

Diese Aufgabe basiert auf der Theorie der Varianzanalyse. BEI Allgemeiner Fall, besteht die Aufgabe der Varianzanalyse darin, diejenigen Faktoren zu identifizieren, die einen signifikanten Einfluss auf das Ergebnis des Experiments haben. Die Varianzanalyse kann verwendet werden, um die Mittelwerte mehrerer Stichproben zu vergleichen, wenn die Anzahl der Stichproben mehr als zwei beträgt. Dazu dient die Einweg-Varianzanalyse.

Zur Lösung der gestellten Aufgaben wird folgendes angenommen. Wenn die Abweichungen der erhaltenen Werte des Optimierungsparameters im Falle des Einflusses von Faktoren von den Abweichungen der Ergebnisse ohne Einfluss von Faktoren abweichen, wird ein solcher Faktor als signifikant anerkannt.

Wie der Problemstellung zu entnehmen ist, werden hier Verfahren zur Prüfung statistischer Hypothesen verwendet, nämlich das Problem der Prüfung zweier empirischer Varianzen. Daher basiert die Varianzanalyse auf der Überprüfung von Varianzen durch das Fisher-Kriterium. Bei dieser Aufgabe ist zu prüfen, ob die Unterschiede in der Zeit zur Lösung der ersten drei Aufgaben des Tests von jedem der sechs Vorschulkinder statistisch signifikant sind.

Die Nullhypothese (Grundhypothese) heißt H o. Das Wesen von e wird auf die Annahme reduziert, dass die Differenz zwischen den verglichenen Parametern Null ist (daher der Name der Hypothese - Null) und dass die beobachteten Unterschiede zufällig sind.

Eine konkurrierende (alternative) Hypothese heißt H 1 , die der Null-Hypothese widerspricht.

Lösung:

Unter Verwendung der Methode der Varianzanalyse auf einem Signifikanzniveau von α = 0,05 testen wir die Nullhypothese (Hо) über das Vorhandensein statistisch signifikanter Unterschiede zwischen dem Zeitpunkt der Lösung der ersten drei Aufgaben des Tests bei sechs Vorschulkindern.

Betrachten Sie die Aufgabenbedingungstabelle, in der wir die durchschnittliche Zeit finden, um jede der drei Testaufgaben zu lösen

Anzahl der Fächer

Faktorstufen

Zeit zum Lösen der ersten Aufgabe des Tests (in Sek.).

Zeit zum Lösen der zweiten Aufgabe des Tests (in Sek.).

Zeit zum Lösen der dritten Aufgabe des Tests (in Sek.).

Gruppendurchschnitt

Ermittlung des Gesamtdurchschnitts:

Um die Signifikanz der Zeitunterschiede jedes Tests zu berücksichtigen, wird die gesamte Stichprobenvarianz in zwei Teile unterteilt, von denen der erste als Faktor und der zweite als Residuum bezeichnet wird

Berechnen Sie mithilfe der Formel die Gesamtsumme der quadrierten Abweichungen der Variante vom Gesamtdurchschnitt

oder , wobei p die Anzahl der Zeitmessungen zum Lösen von Testaufgaben ist, q die Anzahl der Probanden. Dazu erstellen wir eine Option für eine Tabelle mit Quadraten

Anzahl der Fächer

Faktorstufen

Zeit zum Lösen der ersten Aufgabe des Tests (in Sek.).

Zeit zum Lösen der zweiten Aufgabe des Tests (in Sek.).

Zeit zum Lösen der dritten Aufgabe des Tests (in Sek.).

Die Forschung beginnt normalerweise mit einer Annahme, die eine Überprüfung unter Einbeziehung von Fakten erfordert. Diese Annahme – eine Hypothese – wird in Bezug auf den Zusammenhang von Phänomenen oder Eigenschaften in einer bestimmten Menge von Objekten formuliert.

Um solche Annahmen auf Fakten zu überprüfen, ist es notwendig, die entsprechenden Eigenschaften ihrer Träger zu messen. Aber es ist unmöglich, Angst bei allen Frauen und Männern zu messen, ebenso wie es unmöglich ist, Aggressivität bei allen Jugendlichen zu messen. Daher sind sie bei der Durchführung einer Studie auf einen relativ kleinen Kreis von Vertretern der relevanten Bevölkerungsgruppen beschränkt.

Bevölkerung- dies ist die Gesamtheit der Objekte, in Bezug auf die eine Forschungshypothese formuliert wird.

Zum Beispiel alle Männer; oder alle Frauen; oder alle Einwohner einer Stadt. Die allgemeine Bevölkerung, in Bezug auf die der Forscher auf der Grundlage der Ergebnisse der Studie Schlussfolgerungen ziehen wird, kann zahlenmäßig kleiner und bescheidener sein, beispielsweise alle Erstklässler einer bestimmten Schule.

Die Allgemeinbevölkerung ist also zwar nicht unendlich zahlreich, aber in der Regel eine Vielzahl potentieller Themen, die einer kontinuierlichen Forschung nicht zugänglich sind.

Stichprobe oder Stichprobenpopulation- Dies ist eine Gruppe von Objekten mit begrenzter Anzahl (in der Psychologie - Subjekte, Befragte), die speziell aus der allgemeinen Bevölkerung ausgewählt wurden, um ihre Eigenschaften zu untersuchen. Dementsprechend wird die Untersuchung der Eigenschaften der Allgemeinbevölkerung an einer Stichprobe bezeichnet selektive Forschung. Fast alle psychologischen Studien sind selektiv und ihre Schlussfolgerungen gelten für die allgemeine Bevölkerung.

Nachdem also die Hypothese formuliert und die entsprechenden Grundgesamtheiten ermittelt wurden, steht der Forscher vor dem Problem der Organisation der Stichprobe. Die Stichprobe sollte so sein, dass die Verallgemeinerung der Schlussfolgerungen der Stichprobenstudie gerechtfertigt ist - Verallgemeinerung, ihre Verteilung auf die allgemeine Bevölkerung. Die Hauptkriterien für die Gültigkeit der Schlussfolgerungen der Studiedies sind die Repräsentativität der Stichprobe und die statistische Validität der (empirischen) Ergebnisse.

Stichprobenrepräsentativität- mit anderen Worten, ihre Repräsentativität ist die Fähigkeit der Stichprobe, die untersuchten Phänomene ziemlich vollständig zu repräsentieren - unter dem Gesichtspunkt ihrer Variabilität in der Allgemeinbevölkerung.

Natürlich kann nur die allgemeine Bevölkerung ein vollständiges Bild des untersuchten Phänomens in all seiner Bandbreite und Nuancen der Variabilität vermitteln. Daher ist die Repräsentativität immer in dem Maße eingeschränkt, in dem die Stichprobe begrenzt ist. Und es ist die Repräsentativität der Stichprobe, die das Hauptkriterium bei der Bestimmung der Grenzen der Verallgemeinerung der Ergebnisse der Studie ist. Dennoch gibt es Techniken, die es ermöglichen, eine für den Forscher ausreichende repräsentative Stichprobe zu erhalten (Diese Techniken werden im Kurs "Experimentelle Psychologie" untersucht).


Die erste und wichtigste Technik ist eine einfache zufällige (randomisierte) Auswahl. Es geht darum sicherzustellen, dass jedes Mitglied der Bevölkerung die gleichen Chancen hat, in die Stichprobe aufgenommen zu werden. Die Zufallsauswahl bietet die Möglichkeit, in die Stichprobe unterschiedlichster Vertreter der Allgemeinbevölkerung zu gelangen. Gleichzeitig werden besondere Maßnahmen ergriffen, um den Anschein einer Regelmäßigkeit bei der Auswahl auszuschließen. Und das lässt hoffen, dass am Ende in der Stichprobe das untersuchte Gut, wenn nicht in seiner Gesamtheit, so doch in seiner größtmöglichen Vielfalt vertreten sein wird.

Die zweite Möglichkeit, Repräsentativität zu gewährleisten, ist die geschichtete Zufallsauswahl oder die Auswahl nach den Eigenschaften der Allgemeinbevölkerung. Es beinhaltet eine vorläufige Bestimmung der Eigenschaften, die die Variabilität der untersuchten Eigenschaft beeinflussen können (dies können Geschlecht, Einkommensniveau oder Bildung usw. sein). Anschließend wird das prozentuale Verhältnis der Anzahl der sich in diesen Eigenschaften unterscheidenden Gruppen (Schichten) in der Allgemeinbevölkerung ermittelt und ein identisches prozentuales Verhältnis der entsprechenden Gruppen in der Stichprobe bereitgestellt. Weiterhin werden in jeder Untergruppe der Stichprobe die Probanden nach dem Prinzip der einfachen Zufallsauswahl ausgewählt.

Statistische Gültigkeit, oder statistische Signifikanz werden die Ergebnisse der Studie mit Methoden der statistischen Inferenz ermittelt.

Sind wir mit bestimmten Schlussfolgerungen aus den Ergebnissen der Studie gegen Entscheidungsfehler abgesichert? Natürlich nicht. Schließlich basieren unsere Entscheidungen auf den Ergebnissen einer Untersuchung einer Stichprobenpopulation sowie auf unserem psychologischen Wissensstand. Vor Fehlern sind wir nicht ganz gefeit. In der Statistik gelten solche Fehler als akzeptabel, wenn sie höchstens in einem Fall von 1000 auftreten (Irrtumswahrscheinlichkeit α = 0,001 bzw. zugehöriger Wert der Konfidenzwahrscheinlichkeit des richtigen Schlusses p = 0,999); in einem Fall von 100 (Irrtumswahrscheinlichkeit α = 0,01 oder der zugehörige Wert der Konfidenzwahrscheinlichkeit des richtigen Schlusses p = 0,99) oder in fünf Fällen von 100 (Irrtumswahrscheinlichkeit α = 0,05 oder der zugehörige Wert der Konfidenzwahrscheinlichkeit von). die korrekte Ausgabe p=0,95). Es ist in der Psychologie üblich, Entscheidungen auf den letzten beiden Ebenen zu treffen.

Wenn man von statistischer Signifikanz spricht, wird manchmal das Konzept des „Signifikanzniveaus“ (als α bezeichnet) verwendet. Die Zahlenwerte von p und α ergänzen sich bis 1.000 – ein kompletter Satz von Ereignissen: Entweder wir haben es getan richtige Schlussfolgerung oder wir liegen falsch. Diese Pegel werden nicht berechnet, sie werden festgelegt. Das Signifikanzniveau kann als eine Art "rote" Linie verstanden werden, deren Schnittpunkt es uns erlaubt, von diesem Ereignis als nicht zufällig zu sprechen. In jedem kompetenten wissenschaftlichen Bericht oder jeder Veröffentlichung müssen die gezogenen Schlussfolgerungen von einer Angabe der p- oder α-Werte begleitet werden, bei denen die Schlussfolgerungen gezogen werden.

Methoden der statistischen Inferenz werden in der Vorlesung "Mathematische Statistik" ausführlich behandelt. Im Moment stellen wir nur fest, dass sie bestimmte Anforderungen an die Nummer stellen, oder Stichprobengröße.

Leider gibt es keine strengen Empfehlungen zur vorläufigen Bestimmung der erforderlichen Stichprobengröße. Zudem erhält der Forscher auf die Frage nach der notwendigen und ausreichenden Anzahl davon meist zu spät eine Antwort – erst nach Auswertung der Daten der bereits befragten Stichprobe. Die allgemeinsten Empfehlungen können jedoch formuliert werden:

1. Bei der Entwicklung einer Diagnosetechnik wird die größte Stichprobengröße benötigt - von 200 bis 1000-2500 Personen.

2. Wenn es notwendig ist, 2 Proben zu vergleichen, muss ihre Gesamtzahl mindestens 50 Personen betragen; die Anzahl der verglichenen Proben sollte ungefähr gleich sein.

3. Wenn die Beziehung zwischen Eigenschaften untersucht wird, sollte die Stichprobengröße mindestens 30-35 Personen betragen.

4. Je mehr Variabilität der untersuchten Eigenschaft, desto größer sollte die Stichprobengröße sein. Daher kann die Variabilität verringert werden, indem die Homogenität der Stichprobe beispielsweise nach Geschlecht, Alter usw. erhöht wird. Dies verringert natürlich die Möglichkeit, verallgemeinernde Schlussfolgerungen zu ziehen.

Abhängige und unabhängige Stichproben. Eine typische Forschungssituation liegt vor, wenn eine für den Forscher interessante Eigenschaft an zwei oder mehr Proben zum Zwecke ihres weiteren Vergleichs untersucht wird. Diese Proben können je nach Verfahren für ihre Organisation in unterschiedlichen Anteilen vorliegen. Unabhängige Proben zeichnen sich dadurch aus, dass die Auswahlwahrscheinlichkeit eines Subjekts einer Stichprobe nicht von der Auswahl eines Subjekts einer anderen Stichprobe abhängt. Gegen, abhängige Proben zeichnen sich dadurch aus, dass jeder Proband einer Stichprobe nach einem bestimmten Kriterium mit einem Probanden einer anderen Stichprobe abgeglichen wird.

Im Allgemeinen beinhalten abhängige Stichproben eine paarweise Auswahl von Probanden in den verglichenen Stichproben und unabhängige Stichproben - eine unabhängige Auswahl von Probanden.

Es ist zu beachten, dass die Fälle von „teilweise abhängigen“ (oder „teilweise unabhängigen“) Stichproben nicht zulässig sind: Dies verletzt ihre Repräsentativität auf unvorhersehbare Weise.

Abschließend stellen wir fest, dass zwei Paradigmen der psychologischen Forschung unterschieden werden können.

Sogenannt R-Methodik beinhaltet die Untersuchung der Variabilität einer bestimmten Eigenschaft (psychologisch) unter dem Einfluss eines Einflusses, Faktors oder einer anderen Eigenschaft. Die Stichprobe ist eine Reihe von Subjekten.

Ein anderer Ansatz Q-Methodik, beinhaltet die Untersuchung der Variabilität des Subjekts (einzeln) unter dem Einfluss verschiedener Reize (Bedingungen, Situationen usw.). Es entspricht der Situation, wenn die Probe ist eine Reihe von Stimuli.

Bei der Begründung einer statistischen Schlussfolgerung sollte man entscheiden, wo die Grenze zwischen Annahme und Ablehnung der Nullhypothese liegt. Aufgrund zufälliger Einflüsse im Experiment kann diese Grenze nicht absolut exakt gezogen werden. Es basiert auf dem Konzept Signifikanzniveau. Signifikanzniveau ist die Wahrscheinlichkeit, die Nullhypothese fälschlicherweise abzulehnen. Oder mit anderen Worten, Signifikanzniveau - ist die Wahrscheinlichkeit eines Fehlers erster Art bei der Entscheidungsfindung. Um diese Wahrscheinlichkeit zu bezeichnen, verwenden sie in der Regel entweder den griechischen Buchstaben α oder lateinischer Buchstabe R. Im Folgenden verwenden wir den Buchstaben R.

Historisch gesehen wird in den angewandten Wissenschaften, die Statistiken verwenden, und insbesondere in der Psychologie, davon ausgegangen, dass das niedrigste Niveau statistischer Signifikanz das Niveau ist p = 0,05; ausreichend - Niveau R= 0,01 und Höchststufe p = 0,001. Daher werden in den statistischen Tabellen, die im Anhang von Lehrbüchern zur Statistik angegeben sind, normalerweise tabellarische Werte für die Ebenen angegeben p = 0,05, p = 0,01 und R= 0,001. Teilweise werden für Ebenen tabellarische Werte angegeben R - 0,025 und p = 0,005.

Die Werte 0,05, 0,01 und 0,001 sind die sogenannten Standardwerte der statistischen Signifikanz. Bei der statistischen Analyse experimenteller Daten muss der Psychologe je nach Ziel und Hypothese der Studie das erforderliche Signifikanzniveau wählen. Wie Sie sehen können, ist hier der größte Wert, oder Endeffekt das statistische Signifikanzniveau beträgt 0,05 – das bedeutet, dass fünf Fehler in einer Stichprobe von hundert Elementen (Fälle, Subjekte) oder ein Fehler von zwanzig Elementen (Fälle, Subjekte) erlaubt sind. Es wird angenommen, dass weder sechs, noch sieben, noch große Menge mal von hundert können wir uns nicht irren. Die Kosten solcher Fehler wären zu hoch.

Beachten Sie, dass in modernen statistischen Softwarepaketen auf Computern keine Standard-Signifikanzniveaus verwendet werden, sondern Niveaus, die direkt im Prozess der Arbeit mit der entsprechenden statistischen Methode berechnet werden. Diese Ebenen sind mit dem Buchstaben gekennzeichnet R, kann unterschiedlich sein numerischer Ausdruck im Bereich von 0 bis 1, z. p = 0,7, R= 0,23 bzw R= 0,012. Es ist klar, dass in den ersten beiden Fällen die erhaltenen Signifikanzniveaus zu hoch sind und es unmöglich ist, zu sagen, dass das Ergebnis signifikant ist. Gleichzeitig sind im letzteren Fall die Ergebnisse auf dem Niveau von 12 Tausendstel signifikant. Dies ist ein gültiges Niveau.

Die Regel für die Annahme einer statistischen Schlussfolgerung lautet wie folgt: Auf der Grundlage der gewonnenen experimentellen Daten berechnet der Psychologe die sogenannte empirische Statistik oder den Erfahrungswert mit der von ihm gewählten statistischen Methode. Es ist zweckmäßig, diesen Wert als zu bezeichnen H emp . Dann empirische Statistik H emp verglichen mit zwei kritischen Werten, die den 5 %- und 1 %-Signifikanzniveaus für das gewählte statistische Verfahren entsprechen und die als bezeichnet werden H kr . Mengen H kr werden für eine gegebene statistische Methode gemäß den entsprechenden Tabellen gefunden, die im Anhang jedes Lehrbuchs der Statistik enthalten sind. Diese Mengen sind in der Regel immer unterschiedlich und können der Einfachheit halber weiter als bezeichnet werden H cr1 und H kr2 . Kritische Werte aus den Tabellen gefunden H cr1 und H kr2 Es ist zweckmäßig, in der folgenden Standardnotation darzustellen:

Wir betonen jedoch, dass wir die Notation verwendet haben H emp und H kr als Abkürzung des Wortes "Nummer". In allen statistischen Verfahren werden ihre symbolischen Bezeichnungen all dieser Größen akzeptiert: sowohl der durch das entsprechende statistische Verfahren berechnete Erfahrungswert als auch die aus den entsprechenden Tabellen ermittelten kritischen Größen. Bei der Berechnung des Rangkorrelationskoeffizienten nach Spearman aus der Tabelle der kritischen Werte dieses Koeffizienten wurden beispielsweise die folgenden Werte der kritischen Werte gefunden, die für diese Methode mit dem griechischen Buchstaben ρ ("ro") bezeichnet werden . So für p = 0,05 Wert laut Tabelle gefunden ρ kr 1 = 0,61 und für p = 0,01 Wert ρ kr 2 = 0,76.

In der unten angenommenen Standardnotation sieht es so aus:

Jetzt müssen wir unseren Erfahrungswert mit den beiden in den Tabellen gefundenen kritischen Werten vergleichen. Das geht am besten, indem man alle drei Zahlen auf der sogenannten „Signifikanzachse“ platziert. Die „Bedeutungsachse“ ist eine Gerade, an deren linkem Ende 0 steht, obwohl sie in der Regel nicht auf dieser Geraden selbst markiert ist, und die Zahlenreihe von links nach rechts zunimmt. Tatsächlich ist dies die übliche x-Achse der Schule OH Kartesisches Koordinatensystem. Die Besonderheit dieser Achse besteht jedoch darin, dass auf ihr drei Abschnitte, „Zonen“, unterschieden werden. Eine Extremzone wird als Zone der Bedeutungslosigkeit bezeichnet, die zweite Extremzone wird als Zone der Signifikanz bezeichnet, und die Zwischenzone wird als Zone der Unsicherheit bezeichnet. Die Grenzen aller drei Zonen sind H cr1 zum p = 0,05 und H kr2 zum p = 0,01, wie in der Abbildung gezeigt.

Abhängig von der in diesem statistischen Verfahren vorgeschriebenen Entscheidungsregel (Inferenzregel) sind zwei Möglichkeiten möglich.

Option 1: Die Alternativhypothese wird akzeptiert, wenn H empH kr .

Oder die zweite Option: Die Alternativhypothese wird akzeptiert, wenn H empH kr .

Gezählt H emp nach irgendeiner statistischen Methode muss es notwendigerweise in eine der drei Zonen fallen.

Fällt der Erfahrungswert in den unbedeutenden Bereich, so wird die Hypothese H 0 über die Abwesenheit von Unterschieden akzeptiert.

Wenn ein H emp in den Signifikanzbereich fiel, wird die Alternativhypothese H 1 akzeptiert um es gibt Unterschiede, und die Hypothese H 0 wird verworfen.

Wenn ein H emp in die Zone der Ungewissheit gerät, steht der Forscher vor einem Dilemma. Je nach Wichtigkeit des zu lösenden Problems kann er also die erhaltene statistische Schätzung auf einem Niveau von 5% als zuverlässig ansehen und somit die Hypothese H 1 akzeptieren und die Hypothese H 0 ablehnen , oder - auf dem Niveau von 1 % unzuverlässig, wodurch die Hypothese H 0 akzeptiert wird. Wir betonen jedoch, dass dies genau dann der Fall ist, wenn ein Psychologe Fehler erster oder zweiter Art machen kann. Wie oben erörtert, ist es unter diesen Umständen am besten, die Stichprobengröße zu erhöhen.

Wir betonen auch, dass der Wert H emp kann beides genau treffen H cr1 oder H kr2 . Im ersten Fall können wir davon ausgehen, dass die Schätzung genau auf dem Niveau von 5 % zuverlässig ist, und die Hypothese H 1 akzeptieren oder umgekehrt die Hypothese H 0 akzeptieren. Im zweiten Fall wird in der Regel die Alternativhypothese H 1 über das Vorhandensein von Unterschieden akzeptiert und die Hypothese H 0 verworfen.

ZUVERLÄSSIGKEIT STATISTISCH

- Englisch Glaubwürdigkeit/Gültigkeit, statistisch; Deutsch Validität, statistische. Konsistenz, Objektivität und fehlende Zweideutigkeit in einem statistischen Test oder in C.L. Satz von Messungen. D. s. kann getestet werden, indem derselbe Test (oder Fragebogen) zu demselben Thema wiederholt wird, um zu sehen, ob dieselben Ergebnisse erzielt werden; oder Vergleich verschiedene Teile Tests, die dasselbe Objekt messen sollen.

Antinazi. Enzyklopädie der Soziologie, 2009

Sehen Sie, was "STATISTISCHE ZUVERLÄSSIGKEIT" in anderen Wörterbüchern ist:

    ZUVERLÄSSIGKEIT STATISTISCH- Englisch. Glaubwürdigkeit/Gültigkeit, statistisch; Deutsch Validität, statistische. Konsistenz, Objektivität und Unzweideutigkeit in einem statistischen Test oder in einer s. Satz von Messungen. D. s. kann durch Wiederholung desselben Tests verifiziert werden (oder ... ... Wörterbuch in Soziologie

    In der Statistik wird ein Wert als statistisch signifikant bezeichnet, wenn die Wahrscheinlichkeit seines Auftretens durch Zufall oder noch extremere Werte gering ist. Unter dem Extrem wird dabei der Grad der Abweichung der Teststatistik von der Nullhypothese verstanden. Der Unterschied heißt ... ... Wikipedia

    Das physikalische Phänomen der statistischen Stabilität besteht darin, dass mit zunehmender Stichprobengröße die Häufigkeit eines zufälligen Ereignisses oder der Durchschnittswert einer physikalischen Größe zu einer festen Zahl tendiert. Das Phänomen der Statistik ... ... Wikipedia

    ZUVERLÄSSIGKEIT VON UNTERSCHIED (Ähnlichkeit)- analytisches und statistisches Verfahren zur Feststellung des Signifikanzniveaus von Unterschieden oder Ähnlichkeiten zwischen Stichproben gemäß den untersuchten Indikatoren (Variablen) ... Modern Bildungsprozess: grundlegende Konzepte und Begriffe

    BERICHTERSTATTUNG, STATISTISCH Großes Buchhaltungswörterbuch

    BERICHTERSTATTUNG, STATISTISCH- eine Form der staatlichen statistischen Beobachtung, bei der die zuständigen Behörden von Unternehmen (Organisationen und Institutionen) die von ihnen benötigten Informationen in Form von gesetzlich vorgeschriebenen Berichtsunterlagen (Statistikmeldungen) für ... Großes Wirtschaftslexikon

    Die Wissenschaft, die die Methoden der systematischen Beobachtung von Massenphänomenen untersucht soziales Leben Menschen, die Erstellung ihrer numerischen Beschreibungen und die wissenschaftliche Verarbeitung dieser Beschreibungen. Theoretische Statistik ist also eine Wissenschaft ... ... Enzyklopädisches Wörterbuch F. Brockhaus und I.A. Efron

    Korrelationskoeffizient- (Korrelationskoeffizient) Der Korrelationskoeffizient ist ein statistischer Indikator für die Abhängigkeit von zwei zufällige Variablen Definition des Korrelationskoeffizienten, Arten von Korrelationskoeffizienten, Eigenschaften des Korrelationskoeffizienten, Berechnung und Anwendung ... ... Enzyklopädie des Investors

    Statistiken- (Statistik) Statistik ist eine allgemeine theoretische Wissenschaft, die quantitative Veränderungen in Phänomenen und Prozessen untersucht. Regierungsstatistik, Statistikdienste, Rosstat (Goskomstat), statistische Daten, Anfragestatistiken, Verkaufsstatistiken, ... ... Enzyklopädie des Investors

    Korrelation- (Korrelation) Korrelation ist eine statistische Beziehung von zwei oder mehr Zufallsvariablen. Das Konzept der Korrelation, Korrelationsarten, Korrelationskoeffizient, Korrelationsanalyse, Preiskorrelation, Korrelation von Währungspaaren auf Forex-Inhalten ... ... Enzyklopädie des Investors

Bücher

  • Forschung in Mathematik und Mathematik in der Forschung: Methodische Sammlung zu Forschungsaktivitäten von Studenten, Borzenko V.I.. Die Sammlung präsentiert methodische Entwicklungen, die in der Organisation anwendbar sind Forschungstätigkeit Studenten. Der erste Teil der Sammlung widmet sich der Anwendung des Forschungsansatzes in…

Statistische Gültigkeit ist in der Abwicklungspraxis der FCC von erheblicher Bedeutung. Es wurde bereits erwähnt, dass viele Stichproben aus derselben Grundgesamtheit ausgewählt werden können:

Wenn sie richtig ausgewählt werden, unterscheiden sich ihre durchschnittlichen Indikatoren und Indikatoren der allgemeinen Bevölkerung unter Berücksichtigung der akzeptierten Zuverlässigkeit in der Größe des Repräsentativitätsfehlers geringfügig voneinander.

Wenn sie aus verschiedenen Allgemeinpopulationen ausgewählt werden, erweist sich der Unterschied zwischen ihnen als signifikant. Der Vergleich von Stichproben wird üblicherweise in der Statistik berücksichtigt;

Wenn sie sich geringfügig, unbedeutend, unbedeutend unterscheiden, also tatsächlich derselben Grundgesamtheit angehören, wird der Unterschied zwischen ihnen als statistisch unzuverlässig bezeichnet.

statistisch signifikant ein Stichprobenunterschied ist eine Stichprobe, die sich signifikant und grundlegend unterscheidet, d. h. zu unterschiedlichen Grundgesamtheiten gehört.

In der FCC bedeutet die Bewertung der statistischen Signifikanz von Stichprobenunterschieden die Lösung vieler praktischer Probleme. Beispielsweise ist die Einführung neuer Lehrmethoden, Programme, Übungssätze, Tests, Kontrollübungen mit deren experimenteller Überprüfung verbunden, die zeigen soll, dass sich die Testgruppe grundlegend von der Kontrollgruppe unterscheidet. Daher werden spezielle statistische Methoden verwendet, die als statistische Signifikanzkriterien bezeichnet werden, um das Vorhandensein oder Nichtvorhandensein eines statistisch signifikanten Unterschieds zwischen Stichproben festzustellen.

Alle Kriterien sind in zwei Gruppen unterteilt: parametrisch und nichtparametrisch. Parametrische Kriterien sehen das zwingende Vorhandensein eines Normalverteilungsgesetzes vor, d.h. dies bezieht sich auf die verpflichtende Bestimmung der Hauptkennzahlen des Normalrechts - des arithmetischen Mittels und der Standardabweichung s. Parametrische Kriterien sind die genauesten und korrekten. Nichtparametrische Kriterien basieren auf Rangunterschieden (Ordnungsdifferenzen) zwischen den Elementen der Stichproben.

Hier sind die Hauptkriterien für die statistische Signifikanz, die in der Praxis der FCC verwendet werden: Student's Test und Fisher's Test.

Schülerkriterium benannt nach dem englischen Wissenschaftler C. Gosset (Student ist ein Pseudonym), der diese Methode entdeckt hat. Der Student's t-Test ist parametrisch und wird zum Vergleich verwendet absolute Indikatoren Proben. Proben können in der Größe variieren.

Schülerkriterium ist so definiert.

1. Wir finden das Student-Kriterium t nach folgender Formel:


wo sind die arithmetischen Mittel der verglichenen Proben; t 1 , t 2 - Repräsentativitätsfehler, die auf der Grundlage der Indikatoren der verglichenen Stichproben identifiziert wurden.

2. Die Praxis in der FCC hat gezeigt, dass es für die Sportarbeit ausreicht, die Zuverlässigkeit der Punktzahl P = 0,95 zu akzeptieren.

Für die Berechnungssicherheit: P = 0,95 (a = 0,05), mit der Anzahl der Freiheitsgrade

k \u003d n 1 + p 2 - 2 Gemäß der Tabelle in Anhang 4 finden wir den Wert des Grenzwerts des Kriteriums ( t gr).

3. Basierend auf den Eigenschaften des Normalverteilungsgesetzes vergleicht das Student-Kriterium t und tgr.

Wir ziehen Schlussfolgerungen:

wenn t t gr, dann ist der Unterschied zwischen den verglichenen Stichproben statistisch signifikant;

wenn t t gr, dann ist der Unterschied statistisch nicht signifikant.

Für Forscher im Bereich FCC ist die Bewertung der statistischen Signifikanz der erste Schritt zur Lösung eines konkreten Problems: ob sich die verglichenen Stichproben grundlegend unterscheiden oder nicht. Der nächste Schritt besteht darin, diesen Unterschied aus pädagogischer Sicht zu bewerten, die von der Situation des Problems bestimmt wird.

Betrachten Sie die Anwendung des Schülerkriteriums auf ein bestimmtes Beispiel.

Beispiel 2.14. Eine Gruppe von Probanden in der Menge von 18 Personen wurde auf Herzfrequenz (bpm) vor x i und danach untersucht y ich Aufwärmen.

Bewerten Sie die Effektivität des Aufwärmens in Bezug auf die Herzfrequenz. Die Anfangsdaten und Berechnungen sind in der Tabelle dargestellt. 2.30 und 2.31.

Tabelle 2.30

Verarbeitung von Herzfrequenzdaten vor dem Aufwärmen


Die Fehler für beide Gruppen stimmten überein, da die Stichprobenumfänge gleich sind (dieselbe Gruppe wird unter verschiedenen Bedingungen untersucht) und die Standardabweichungen s x = s y = 3 bpm waren. Kommen wir zur Definition des Student-Kriteriums:

Wir setzen die Zuverlässigkeit des Kontos: Р= 0,95.

Die Anzahl der Freiheitsgrade k 1 \u003d n 1 + p 2 - 2 \u003d 18 + 18-2 \u003d 34. Gemäß der Tabelle in Anhang 4 finden wir t gr= 2,02.

Statistische Inferenz. Da t \u003d 11,62 und die Grenze t gr \u003d 2,02, dann 11,62\u003e 2,02, d.h. t > tgr, also ist der Unterschied zwischen den Stichproben statistisch signifikant.

Pädagogischer Abschluss. Es wurde festgestellt, dass in Bezug auf die Herzfrequenz der Unterschied zwischen dem Zustand der Gruppe vor und nach dem Aufwärmen statistisch signifikant ist, d.h. bedeutend, wichtig. Anhand der Herzfrequenzanzeige können wir also schlussfolgern, dass das Aufwärmen effektiv ist.

Fishers Kriterium ist parametrisch. Es wird verwendet, wenn die Streuraten von Proben verglichen werden. Dies bedeutet in der Regel einen Vergleich in Bezug auf die Stabilität der sportlichen Arbeit oder die Stabilität funktionaler und technischer Indikatoren in der Praxis. Bewegungserziehung, Körpererziehung, Leibeserziehung und Sport. Proben können unterschiedliche Größen haben.

Das Fisher-Kriterium wird in der folgenden Sequenz definiert.

1. Ermitteln Sie das Fisher-Kriterium F anhand der Formel


wobei , die Varianzen der verglichenen Stichproben sind.

Die Bedingungen des Fisher-Kriteriums liefern dies im Zähler der Formel F Es gibt eine große Varianz, d.h. F ist immer größer als eins.

Wir legen die Zuverlässigkeit des Kontos fest: P = 0,95 - und bestimmen die Anzahl der Freiheitsgrade für beide Stichproben: k 1 = n 1 - 1, k 2 = n 2 - 1.

Gemäß der Tabelle in Anhang 4 finden wir den Grenzwert des Kriteriums F GR.

Vergleich der Kriterien F und F GR lässt uns folgende Schlussfolgerungen ziehen:

wenn F > Fgr, dann ist der Unterschied zwischen den Proben statistisch signifikant;

wenn f< F гр, то различие между выборками статически недо­стоверно.

Nehmen wir ein konkretes Beispiel.

Beispiel 2.15. Analysieren wir zwei Gruppen von Handballspielern: x ich (n 1= 16 Personen) und y i (n 2 = 18 Personen). Diese Sportlergruppen wurden auf die Abstoßzeit(en) beim Werfen des Balls ins Tor untersucht.

Sind die Abstoßungsraten gleich?

Anfangsdaten und grundlegende Berechnungen sind in der Tabelle dargestellt. 2.32 und 2.33.

Tabelle 2.32

Verarbeitung von Abstoßungsindikatoren der ersten Handballergruppe


Lassen Sie uns das Fisher-Kriterium definieren:





Gemäß den in der Tabelle von Anhang 6 präsentierten Daten finden wir Fgr: Fgr = 2,4

Beachten wir, dass in der Tabelle des Anhangs 6 die Aufzählung der Anzahl der Freiheitsgrade sowohl größerer als auch geringerer Streuung bei Annäherung an große Zahlen gröber wird. Die Anzahl der Freiheitsgrade einer größeren Dispersion folgt also in dieser Reihenfolge: 8, 9, 10, 11, 12, 14, 16, 20, 24 usw. und einer kleineren - 28, 29, 30, 40, 50 usw. d.

Dies erklärt sich dadurch, dass mit zunehmendem Stichprobenumfang die Unterschiede im F-Test abnehmen und Tabellenwerte, die nahe an den Originaldaten liegen, verwendet werden können. In Beispiel 2.15 fehlt also =17 und wir können den nächstliegenden Wert k = 16 nehmen, woraus wir Fgr = 2.4 erhalten.

Statistische Inferenz. Da der Fisher-Test F = 2,5 > F = 2,4 ist, sind die Stichproben statistisch signifikant.

Pädagogischer Abschluss. Die Werte der Abstoßzeit(en) beim Einwurf des Balles ins Tor der Handballer beider Gruppen unterscheiden sich deutlich. Diese Gruppen sollten als unterschiedlich betrachtet werden.

Weitere Untersuchungen sollten zeigen, was der Grund für diesen Unterschied ist.

Beispiel 2.20.(über die statistische Signifikanz der Stichprobe ). Hat sich die Qualifikation des Fußballspielers erhöht, wenn die Zeit(en) von der Signalgabe bis zum Treten des Balls zu Beginn des Trainings x i und am Ende i war.

Die Anfangsdaten und Grundberechnungen sind in der Tabelle angegeben. 2.40 und 2.41.

Tabelle 2.40

Verarbeitung von Zeitindikatoren vom Signalgeben bis zum Schlagen des Balls zu Beginn eines Trainings


Lassen Sie uns den Unterschied zwischen Gruppen von Indikatoren nach dem Student-Kriterium bestimmen:

Mit Zuverlässigkeit P \u003d 0,95 und Freiheitsgraden k \u003d n 1 + n 2 - 2 \u003d 22 + 22 - 2 \u003d 42 finden wir gemäß der Tabelle in Anhang 4 t gr= 2,02. Da t = 8,3 > t gr= 2,02 - der Unterschied ist statistisch signifikant.

Bestimmen wir den Unterschied zwischen den Indikatorengruppen nach dem Fisher-Kriterium:


Gemäß der Tabelle in Anhang 2 ist bei Zuverlässigkeit P = 0,95 und Freiheitsgraden k = 22-1 = 21 der Wert von F gr = 21. Da F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Statistische Inferenz. Nach dem arithmetischen Mittel ist der Unterschied zwischen den Indikatorengruppen statistisch signifikant. Hinsichtlich der Streuung (Streuung) ist der Unterschied zwischen den Indikatorengruppen statistisch nicht signifikant.

Pädagogischer Abschluss. Die Qualifikation des Fußballers hat sich deutlich verbessert, aber die Stabilität seiner Aussage sollte beachtet werden.

Vorbereitung auf die Arbeit

Vor dem Labor arbeit in der Disziplin "Sportmesstechnik" an alle Schüler Studiengruppe es ist notwendig, Arbeitsgruppen von jeweils 3-4 Studierenden zu bilden, den Arbeitsauftrag aller Laborarbeiten gemeinsam zu erledigen.

In Vorbereitung auf die Arbeit Machen Sie sich mit den relevanten Abschnitten der empfohlenen Literatur (siehe Abschnitt 6 dieser Richtlinien) und Vorlesungsunterlagen vertraut. Studieren Sie die Abschnitte 1 und 2 für dieses Praktikum sowie die Arbeitsaufgabe dafür (Abschnitt 4).

Bereiten Sie ein Berichtsformular vor auf Standardblätter A4-Briefpapier und legen Sie die für die Arbeit erforderlichen Materialien hinein.

Der Bericht muss enthalten :

Titelblatt mit Angabe des Fachbereichs (UK und TR), Studiengruppe, Nachname, Vorname, Patronym des Studierenden, Nummer und Name der Laborarbeit, Datum ihrer Fertigstellung sowie Nachname, akademischer Grad, akademischer Titel und Position der Lehrer, der die Arbeit annimmt;

Zielsetzung;

Formeln mit Zahlenwerten, die die Zwischen- und Endergebnisse von Berechnungen erklären;

Tabellen gemessener und berechneter Werte;

Erforderliches Bildmaterial für die Aufgabe;

Kurze Schlussfolgerungen nach den Ergebnissen der einzelnen Phasen der Arbeitsaufgabe und im Allgemeinen nach der durchgeführten Arbeit.

Alle Grafiken und Tabellen werden mit Zeichenwerkzeugen genau gezeichnet. Bedingte grafische und alphabetische Bezeichnungen müssen GOSTs entsprechen. Es ist erlaubt, einen Bericht unter Verwendung von Computer-(Computer-)Technologie zu erstellen.

Arbeitsaufgabe

Vor der Durchführung aller Messungen muss jedes Teammitglied die Regeln für die Verwendung des Sportspiels Darts in Anhang 7 studieren, die für die Durchführung der folgenden Forschungsphasen erforderlich sind.

I - te Phase der Forschung„Die Untersuchung der Ergebnisse des Treffens des Ziels des Sportspiels Darts durch jedes Mitglied der Brigade für die Einhaltung des normalen Verteilungsgesetzes gemäß dem Kriterium x 2 Pearson und der Drei-Sigma-Test“

1. messen (testen) Sie Ihre (persönliche) Schnelligkeit und Handlungskoordination, durch 30- bis 40-maliges Werfen von Dartpfeilen auf die kreisförmige Zielscheibe des Sportspiels Darts.

2. Messergebnisse (Tests) x ich(in Punkten) in Form einer Variationsreihe anordnen und in Tabelle 4.1 (Spalten) eintragen, alle notwendigen Berechnungen durchführen, die notwendigen Tabellen ausfüllen und die entsprechenden Schlussfolgerungen über die Übereinstimmung der erhaltenen empirischen Verteilung mit dem Normalverteilungsgesetz ziehen, in Analogie zu ähnlichen Berechnungen, Tabellen und Schlussfolgerungen von Beispiel 2.12, die in Abschnitt 2 dieser Richtlinie auf den Seiten 7-10 angegeben sind.

Tabelle 4.1

Entsprechung der Geschwindigkeit und Koordination der Handlungen der Subjekte mit dem normalen Verteilungsgesetz

Nr. p / p gerundet
Gesamt

II - Stufe der Forschung

"Bewertung der durchschnittlichen Indikatoren der Gesamtbevölkerung von Treffern auf das Ziel des Sportspiels Darts aller Schüler der Bildungsgruppe basierend auf den Ergebnissen von Messungen von Mitgliedern einer Brigade"

Bewerten Sie die durchschnittlichen Indikatoren für die Geschwindigkeit und Koordination der Aktionen aller Schüler der Lerngruppe (gemäß der Liste der Lerngruppe der Klassenzeitschrift) basierend auf den Ergebnissen des Treffens des Ziels des Sportspiels Darts durch alle Mitglieder der Team, erhalten in der ersten Phase der Forschung dieser Laborarbeit.

1. Dokumentieren Sie die Ergebnisse von Geschwindigkeitsmessungen und Koordination von Aktionen beim Werfen von Dartpfeilen auf eine kreisförmige Zielscheibe des Sportspiels Darts aller Mitglieder Ihres Teams (2 - 4 Personen), die eine Auswahl von Messergebnissen aus der Allgemeinbevölkerung sind (Messergebnisse aller Studierenden der Studiengruppe - z. 15 Personen), Eintragung in die zweite und dritte Spalte Tabelle 4.2.

Tabelle 4.2

Verarbeitung von Geschwindigkeitsindikatoren und Koordination von Aktionen

Brigademitglieder

Nr. p / p
Gesamt

Tabelle 4.2 unten sollte verstanden werden , übereinstimmende Durchschnittsnote (siehe Berechnungsergebnisse nach Tabelle 4.1) Mitglieder Ihres Teams , in der ersten Phase der Forschung erhalten. Es sollte erwähnt werden, dass, allgemein, In Tabelle 4.2 ist ein berechneter Mittelwert der Messergebnisse aufgeführt, die von einem Mitglied des Teams in der ersten Phase der Untersuchung erzielt wurden , da die Wahrscheinlichkeit, dass die Messergebnisse verschiedener Teammitglieder übereinstimmen, sehr gering ist. Dann, normalerweise Werte in einer Spalte Tabellen 4.2 für jede der Zeilen - sind gleich 1, a in der Zeile „Gesamt » Spalten « », geschrieben wird die Anzahl der Mitglieder Ihres Teams.

2. Führen Sie alle notwendigen Berechnungen durch, um Tabelle 4.2 auszufüllen, sowie andere Berechnungen und Schlussfolgerungen ähnlich den Berechnungen und Schlussfolgerungen von Beispiel 2.13, die im 2. Abschnitt dieses Dokuments angegeben sind methodische Entwicklung auf den Seiten 13-14. Dies sollte bei der Berechnung des Repräsentativitätsfehlers berücksichtigt werden "m" Es ist notwendig, Formel 2.4 zu verwenden, die auf Seite 13 dieser methodischen Entwicklung angegeben ist, da die Stichprobe klein ist (n, und die Anzahl der Elemente der Allgemeinbevölkerung N bekannt ist und gleich der Anzahl der Studenten in der Studiengruppe ist , gemäß der Liste der Zeitschrift der Studiengruppe.

III - Stufe der Forschung

Bewertung der Wirksamkeit des Aufwärmens in Bezug auf "Geschwindigkeit und Koordination der Aktionen" durch jedes Teammitglied anhand des Student-Kriteriums

Um die Wirksamkeit des Aufwärmens zum Werfen von Darts auf das Ziel des Sportspiels "Darts" zu bewerten, das in der ersten Phase der Forschung dieser Laborarbeit von jedem Mitglied des Teams in Bezug auf "Geschwindigkeit und Koordination von Aktionen", unter Verwendung des Student-Kriteriums - ein parametrisches Kriterium der statistischen Zuverlässigkeit des empirischen Verteilungsgesetzes zum normalen Verteilungsgesetz.

… Gesamt

2. Streuung und Nordkasachstan , die Ergebnisse der Messungen des Indikators "Geschwindigkeit und Koordination von Aktionen" basierend auf den Ergebnissen des Aufwärmens, in Tabelle 4.3 angegeben, (siehe ähnliche Berechnungen unmittelbar nach Tabelle 2.30 von Beispiel 2.14 auf Seite 16 dieser methodologischen Entwicklung).

3. Jedes Mitglied des Arbeitsteams messen (testen) Sie Ihre (persönliche) Schnelligkeit und Handlungskoordination nach dem Aufwärmen,

… Gesamt

5. Führen Sie Durchschnittsberechnungen durch Streuung und Nordkasachstan ,die Ergebnisse der Messungen des Indikators "Geschwindigkeit und Koordination von Aktionen" nach dem Aufwärmen, in Tabelle 4.4 angegeben, Schreiben Sie das Gesamtergebnis der Messungen auf der Grundlage der Ergebnisse des Aufwärmens auf (siehe ähnliche Berechnungen unmittelbar nach Tabelle 2.31 von Beispiel 2.14 auf Seite 17 dieser methodologischen Entwicklung).

6. Führen Sie alle notwendigen Berechnungen und Schlussfolgerungen durch, ähnlich den Berechnungen und Schlussfolgerungen von Beispiel 2.14, die im 2. Abschnitt dieser methodischen Entwicklung auf den Seiten 16-17 angegeben sind. Dies sollte bei der Berechnung des Repräsentativitätsfehlers berücksichtigt werden "m" Es ist notwendig, Formel 2.1 zu verwenden, die auf Seite 12 dieser methodischen Entwicklung angegeben ist, da die Stichprobe n ist und die Anzahl der Elemente der Grundgesamtheit N ( unbekannt ist.

IV - Stufe der Forschung

Bewertung der Einheitlichkeit (Stabilität) der Indikatoren "Geschwindigkeit und Koordination von Aktionen" von zwei Teammitgliedern anhand des Fisher-Kriteriums

Bewerten Sie die Einheitlichkeit (Stabilität) der Indikatoren "Geschwindigkeit und Koordination der Aktionen" von zwei Teammitgliedern anhand des Fisher-Kriteriums gemäß den Messergebnissen, die in der dritten Phase der Forschung dieser Laborarbeit erhalten wurden.

Gehen Sie dazu wie folgt vor.

Unter Verwendung der Daten der Tabellen 4.3 und 4.4, der Ergebnisse der Berechnung der Streuungen für diese Tabellen, die in der dritten Forschungsphase erhalten wurden, sowie der Methodik zur Berechnung und Anwendung des Fisher-Kriteriums zur Bewertung der Einheitlichkeit (Stabilität) von Sportindikatoren, die in Beispiel 2.15 auf den Seiten 18-19 dieser methodologischen Entwicklung gegeben sind, geeignete statistische und pädagogische Schlussfolgerungen ziehen.

V - Stufe der Forschung

Bewertung der Indikatorengruppen "Geschwindigkeit und Koordination der Aktionen" eines Teammitglieds vor und nach dem Aufwärmen