Significancia estadística

Los resultados obtenidos mediante un procedimiento de investigación particular se denominan Estadísticamente significante, si la probabilidad de que ocurran aleatoriamente es muy pequeña. Este concepto se puede ilustrar con el ejemplo de lanzar una moneda al aire. Supongamos que se lanza la moneda 30 veces; Salió cara 17 veces y cruz 13 veces. Lo hace significativo desviación de este resultado del esperado (15 caras y 15 cruces), ¿o es esta desviación aleatoria? Para responder a esta pregunta, puedes, por ejemplo, lanzar la misma moneda muchas veces, 30 veces seguidas, y al mismo tiempo observar cuántas veces se repite la proporción de “cara” a “cruz” de 17:13. El análisis estadístico nos salva de este tedioso proceso. Con su ayuda, después de los primeros 30 lanzamientos de una moneda, se puede estimar el número posible de apariciones aleatorias de 17 “caras” y 13 “cruces”. Esta evaluación se denomina enunciado probabilístico.

EN literatura cientifica en psicología industrial-organizacional, un enunciado probabilístico en forma matemática se denota mediante la expresión R(probabilidad)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (R< 0,01). Este hecho es importante para comprender la literatura, pero no debe interpretarse como que no tiene sentido realizar observaciones que no cumplan con estos estándares. Los llamados resultados de investigación no significativos (observaciones que pueden obtenerse por casualidad) más una a cinco veces de cada 100) puede ser muy útil para identificar tendencias y como guía para futuras investigaciones.

También cabe señalar que no todos los psicólogos están de acuerdo con los estándares y procedimientos tradicionales (p. ej., Cohen, 1994; Sauley y Bedeian, 1989). Los problemas de medición son en sí mismos tema principal el trabajo de muchos investigadores que estudian la precisión de los métodos de medición y las premisas que subyacen métodos existentes y estándares, además de desarrollar nuevos doctores y herramientas. Quizás en algún momento en el futuro, la investigación con este poder conduzca a cambios en los estándares tradicionales para evaluar la significancia estadística, y estos cambios ganarán una aceptación generalizada. (La Quinta División de la Asociación Estadounidense de Psicología es un grupo de psicólogos que se especializan en el estudio de la evaluación, la medición y la estadística).

En los informes de investigación, una declaración probabilística como R< 0,05, debido a algunos Estadísticas, es decir, un número que se obtiene como resultado de un determinado conjunto de procedimientos computacionales matemáticos. La confirmación probabilística se obtiene comparando estas estadísticas con datos de tablas especiales que se publican para este fin. En la investigación psicológica industrial-organizacional, estadísticas como r, F, t, r>(léase “chi cuadrado”) y R(léase "plural" R"). En cada caso, las estadísticas (un número) obtenidas del análisis de una serie de observaciones se pueden comparar con números de una tabla publicada. Después de esto, puede formular un enunciado probabilístico sobre la probabilidad de obtener este número al azar, es decir, sacar una conclusión sobre la importancia de las observaciones.

Para comprender los estudios descritos en este libro, basta con tener una comprensión clara del concepto de significancia estadística y no necesariamente saber cómo se calculan las estadísticas mencionadas anteriormente. Sin embargo, sería útil discutir un supuesto que subyace a todos estos procedimientos. Ésta es la suposición de que todas las variables observadas tienen una distribución aproximadamente normal. Además, al leer informes de investigaciones psicológicas industriales y organizativas, a menudo se encuentran otros tres conceptos que juegan un papel importante. papel importante- en primer lugar, correlación y conexión de correlación, en segundo lugar, la variable determinante/predictora y ANOVA ( Análisis de variación), en tercer lugar, un grupo de métodos estadísticos bajo nombre común"metanálisis".

Consideremos un ejemplo típico de la aplicación de métodos estadísticos en medicina. Los creadores del fármaco sugieren que aumenta la diuresis en proporción a la dosis tomada. Para probar esta hipótesis, administran a cinco voluntarios diferentes dosis del fármaco.

Según los resultados de la observación, se traza una gráfica de diuresis versus dosis (fig. 1.2A). La dependencia es visible a simple vista. Los investigadores se felicitan unos a otros por el descubrimiento y al mundo por el nuevo diurético.

De hecho, los datos sólo nos permiten afirmar de forma fiable que se observó una diuresis dosis-dependiente en estos cinco voluntarios. El hecho de que esta dependencia se manifestará en todas las personas que toman el medicamento no es más que una suposición.
zy

Con

vida No se puede decir que sea infundado; de lo contrario, ¿por qué realizar experimentos?

Pero la droga salió a la venta. Todo mas gente tomarlo con la esperanza de aumentar su producción de orina. Entonces ¿Qué vemos? Vemos la Figura 1.2B, que indica la ausencia de cualquier conexión entre la dosis del fármaco y la diuresis. Los círculos negros indican datos del estudio original. La estadística tiene métodos que nos permiten estimar la probabilidad de obtener una muestra tan “poco representativa” y, de hecho, confusa. Resulta que, en ausencia de una conexión entre la diuresis y la dosis del fármaco, la “dependencia” resultante se observaría en aproximadamente 5 de cada 1000 experimentos. Entonces, en este caso, los investigadores simplemente no tuvieron suerte. Incluso si hubieran utilizado los métodos estadísticos más avanzados, eso no les habría impedido cometer errores.

Hemos dado este ejemplo ficticio, pero nada alejado de la realidad, para no señalar la inutilidad.
ness de las estadísticas. Habla de otra cosa, del carácter probabilístico de sus conclusiones. Como resultado de aplicar el método estadístico, no obtenemos la verdad última, sino sólo una estimación de la probabilidad de un supuesto particular. Además, cada método estadístico se basa en sus propios modelo matemático y sus resultados son correctos en la medida en que este modelo se corresponde con la realidad.

Más sobre el tema CONFIABILIDAD Y SIGNIFICADO ESTADÍSTICO:

  1. Diferencias estadísticamente significativas en los indicadores de calidad de vida.
  2. Población estadística. Características contables. El concepto de investigación continua y selectiva. Requisitos para datos estadísticos y el uso de documentos contables y de presentación de informes.
  3. ABSTRACTO. ESTUDIO DE CONFIABILIDAD DE LAS INDICACIONES DE TONÓMETRO PARA MEDIR LA PRESIÓN INTRAOCULAR A TRAVÉS DEL PÁRPADO 2018, 2018

En cualquier situación científica y práctica de un experimento (encuesta), los investigadores no pueden estudiar a todas las personas (población general, población), sino solo una muestra determinada. Por ejemplo, incluso si estamos estudiando un grupo relativamente pequeño de personas, como aquellas que padecen una enfermedad particular, es muy poco probable que tengamos los recursos adecuados o la necesidad de realizar pruebas a cada paciente. En cambio, es común analizar una muestra de la población porque es más conveniente y requiere menos tiempo. Si es así, ¿cómo sabemos que los resultados obtenidos de la muestra son representativos de todo el grupo? O, para usar terminología profesional, ¿podemos estar seguros de que nuestra investigación describe correctamente toda la situación? población, ¿la muestra que utilizamos?

Para responder a esta pregunta, es necesario determinar la significación estadística de los resultados de la prueba. Significancia estadística (Nivel significante, abreviado sig.), o nivel de significancia /7 (nivel p) - es la probabilidad de que un resultado dado represente correctamente la población de la cual se tomó la muestra del estudio. Tenga en cuenta que esto es sólo probabilidad- es imposible decir con absoluta certeza que un estudio determinado describe correctamente a toda la población. En el mejor de los casos, el nivel de significancia sólo puede concluir que esto es muy probable. Así surge inevitablemente próxima pregunta: ¿Qué nivel de significancia debe tener para que este resultado sea considerado una característica correcta de la población?

Por ejemplo, ¿a qué valor de probabilidad está usted dispuesto a decir que esas posibilidades son suficientes para correr un riesgo? ¿Qué pasa si las probabilidades son 10 sobre 100 o 50 sobre 100? ¿Qué pasa si esta probabilidad es mayor? ¿Qué pasa con probabilidades como 90 sobre 100, 95 sobre 100 o 98 sobre 100? Para una situación de riesgo, esta elección es bastante problemática, porque depende de las características personales de la persona.

En psicología, tradicionalmente se cree que una probabilidad de 95 o más sobre 100 significa que la probabilidad de que los resultados sean correctos es lo suficientemente alta como para que sean generalizables a toda la población. Esta cifra se estableció en el proceso de actividad científica y práctica: no existe una ley según la cual deba elegirse como guía (y de hecho, en otras ciencias a veces se eligen otros valores del nivel de significancia).

En psicología operan con esta probabilidad varias veces. de una manera inusual. En lugar de la probabilidad de que la muestra represente a la población, la probabilidad de que la muestra no representa población. En otras palabras, es la probabilidad de que la relación o diferencias observadas sean aleatorias y no una propiedad de la población. Entonces, en lugar de decir que hay una probabilidad de 95 entre 100 de que los resultados de un estudio sean correctos, los psicólogos dicen que hay una probabilidad de 5 entre 100 de que los resultados sean incorrectos (así como una probabilidad de 40 entre 100 de que los resultados sean correctos significa una probabilidad de 60 entre 100 a favor de su incorrección). El valor de probabilidad a veces se expresa como porcentaje, pero más a menudo se escribe como decimal. Por ejemplo, 10 posibilidades sobre 100 se expresan como una fracción decimal de 0,1; 5 de 100 se escribe como 0,05; 1 de 100 - 0,01. Con esta forma de registro el valor límite es 0,05. Para que un resultado se considere correcto, su nivel de significancia debe ser abajo este número (recuerde, esta es la probabilidad de que el resultado equivocado describe la población). Para dejar de lado la terminología, agreguemos que la “probabilidad de que el resultado sea incorrecto” (que se llama más correctamente Nivel significativo) generalmente denotado letra latina r. Las descripciones de los resultados experimentales generalmente incluyen una declaración resumida como "los resultados fueron significativos en el nivel de confianza". (R(p) menos de 0,05 (es decir, menos del 5%).

Por lo tanto, el nivel de significancia ( R) indica la probabilidad de que los resultados No representan a la población. Tradicionalmente en psicología se cree que los resultados reflejan de forma fiable cuadro grande, si valor R menos del 0,05 (es decir, el 5%). Sin embargo, esto es sólo una afirmación probabilística y no una garantía incondicional. En algunos casos esta conclusión puede no ser correcta. De hecho, podemos calcular con qué frecuencia esto podría suceder si observamos la magnitud del nivel de significancia. Con un nivel de significancia de 0,05, es probable que 5 de cada 100 veces los resultados sean incorrectos. 11a a primera vista parece que esto no es muy común, pero si lo piensas bien, entonces 5 posibilidades de 100 es lo mismo que 1 de 20. Es decir, en uno de cada 20 casos el resultado será incorrecto. Estas probabilidades no parecen particularmente favorables y los investigadores deben tener cuidado de no cometer errores del primer tipo. Así se llama el error que se produce cuando los investigadores creen que han encontrado resultados reales, pero en realidad no es así. El error contrario, que consiste en que los investigadores crean que no han encontrado un resultado cuando en realidad sí lo hay, se denomina errores del segundo tipo.

Estos errores surgen porque no se puede descartar la posibilidad de que el análisis estadístico realizado. La probabilidad de error depende del nivel de significancia estadística de los resultados. Ya hemos señalado que para que un resultado se considere correcto, el nivel de significancia debe ser inferior a 0,05. Por supuesto, algunos resultados son más nivel bajo, y no es raro encontrar resultados tan bajos como 0,001 (un valor de 0,001 indica que los resultados tienen una probabilidad de 1 entre 1000 de ser incorrectos). Cómo menos valor p, mayor será nuestra confianza en la exactitud de los resultados.

En mesa 7.2 muestra la interpretación tradicional de los niveles de significancia sobre la posibilidad de inferencia estadística y el fundamento de la decisión sobre la presencia de una relación (diferencias).

Tabla 7.2

Interpretación tradicional de los niveles de significancia utilizados en psicología.

Con base en la experiencia de la investigación práctica, se recomienda: para evitar al máximo los errores del primer y segundo tipo, al sacar conclusiones importantes, se deben tomar decisiones sobre la presencia de diferencias (conexiones), centrándose en el nivel. R n signo.

prueba estadistica(Prueba estadística - es una herramienta para determinar el nivel de significación estadística. Esta es una regla decisiva que garantiza que se acepte una hipótesis verdadera y se rechace una hipótesis falsa con una alta probabilidad.

Criterios estadísticos También denota el método para calcular un determinado número y el número en sí. Todos los criterios se utilizan con un propósito principal: determinar Nivel significativo los datos que analizan (es decir, la probabilidad de que los datos reflejen un efecto real que represente correctamente la población de la que se extrae la muestra).

Algunas pruebas solo se pueden utilizar para datos distribuidos normalmente (y si el rasgo se mide en una escala de intervalo); estas pruebas generalmente se denominan paramétrico. Con otros criterios, puede analizar datos con casi cualquier ley de distribución; se denominan no paramétrico.

Los criterios paramétricos son criterios que incluyen parámetros de distribución en la fórmula de cálculo, es decir, medias y varianzas (prueba t de Student, prueba F de Fisher, etc.).

Los criterios no paramétricos son criterios que no incluyen parámetros de distribución en la fórmula para calcular los parámetros de distribución y se basan en operar con frecuencias o rangos (criterio q Criterio de Rosenbaum Ud. Maná - Whitney

Por ejemplo, cuando decimos que la importancia de las diferencias fue determinada por la prueba t de Student, queremos decir que se utilizó el método de la prueba t de Student para calcular el valor empírico, que luego se compara con el valor tabulado (crítico).

Por la relación entre los valores empíricos (calculados por nosotros) y críticos del criterio (tabulares) podemos juzgar si nuestra hipótesis está confirmada o refutada. En la mayoría de los casos, para que reconozcamos las diferencias como significativas, es necesario que el valor empírico del criterio supere el valor crítico, aunque existen criterios (por ejemplo, la prueba de Mann-Whitney o la prueba de signos) en los que debemos atenernos a la regla opuesta.

En algunos casos, la fórmula de cálculo del criterio incluye el número de observaciones en la muestra en estudio, denotado como PAG. Utilizando una tabla especial, determinamos a qué nivel de significación estadística de las diferencias corresponde un valor empírico determinado. En la mayoría de los casos, el mismo valor empírico del criterio puede ser significativo o insignificante dependiendo del número de observaciones en la muestra en estudio ( PAG ) o del llamado numero de grados de libertad , que se denota como v (g>) o cómo df (A veces d).

Conocimiento PAG o el número de grados de libertad, utilizando tablas especiales (las principales se dan en el Apéndice 5) podemos determinar los valores críticos del criterio y comparar el valor empírico obtenido con ellos. Esto generalmente se escribe así: “cuando norte = 22 valores críticos del criterio son t St = 2,07" o "en v (d) = 2 valores críticos de la prueba de Student son = 4.30”, etc.

Por lo general, todavía se da preferencia a los criterios paramétricos y nosotros mantenemos esta posición. Se consideran más fiables y pueden proporcionar más información y análisis más profundos. En cuanto a la complejidad de los cálculos matemáticos, al utilizar programas de computador esta dificultad desaparece (pero algunas otras parecen, sin embargo, bastante superables).

  • En este libro de texto no consideramos en detalle el problema de la estadística.
  • hipótesis (nula - R0 y alternativa - Hj) y decisiones estadísticas tomadas, ya que los estudiantes de psicología estudian esto por separado en la disciplina "Métodos matemáticos en psicología". Además, cabe señalar que al preparar un informe de investigación (trabajo de curso o tesis, publicaciones) Las hipótesis estadísticas y las soluciones estadísticas, por regla general, no se dan. Por lo general, al describir los resultados, indican el criterio, proporcionan las estadísticas descriptivas necesarias (medias, sigma, coeficientes de correlación, etc.), valores empíricos de los criterios, grados de libertad y necesariamente el nivel p de significancia. Luego se formula una conclusión significativa con respecto a la hipótesis que se está probando, indicando (generalmente en forma de desigualdad) el nivel de significancia alcanzado o no alcanzado.

La confiabilidad estadística es esencial en la práctica de cálculo de la FCC. Anteriormente se señaló que se pueden seleccionar múltiples muestras de la misma población:

Si se seleccionan correctamente, entonces sus indicadores promedio y los indicadores de la población general difieren ligeramente entre sí en la magnitud del error de representatividad, teniendo en cuenta la confiabilidad aceptada;

Si se seleccionan de diferentes poblaciones, la diferencia entre ellos resulta significativa. La estadística consiste en comparar muestras;

Si difieren de manera insignificante, no principal, insignificante, es decir, en realidad pertenecen a la misma población general, la diferencia entre ellos se considera estadísticamente poco confiable.

Estadísticamente confiable Una diferencia muestral es una muestra que difiere significativa y fundamentalmente, es decir, pertenece a poblaciones generales diferentes.

En la FCC, evaluar la significancia estadística de las diferencias muestrales significa resolver muchos problemas prácticos. Por ejemplo, la introducción de nuevos métodos de enseñanza, programas, conjuntos de ejercicios, pruebas y ejercicios de control está asociada con sus pruebas experimentales, lo que debería mostrar que el grupo de prueba es fundamentalmente diferente del grupo de control. Por lo tanto, se utilizan métodos estadísticos especiales, llamados criterios de significación estadística, para detectar la presencia o ausencia de una diferencia estadísticamente significativa entre muestras.

Todos los criterios se dividen en dos grupos: paramétricos y no paramétricos. Los criterios paramétricos requieren la presencia de una ley de distribución normal, es decir Esto significa la determinación obligatoria de los principales indicadores de la ley normal: la media aritmética y la desviación estándar s. Los criterios paramétricos son los más precisos y correctos. Las pruebas no paramétricas se basan en diferencias de rango (ordinales) entre elementos de la muestra.

Estos son los principales criterios de significación estadística utilizados en la práctica de la FCC: prueba de Student y prueba de Fisher.

prueba t de Student lleva el nombre del científico inglés K. Gosset (Estudiante - seudónimo), quien descubrió este método. La prueba t de Student es paramétrica y se utiliza para comparar. indicadores absolutos muestras. Las muestras pueden variar en tamaño.

prueba t de Student se define así.

1. Encuentre la prueba t de Student usando la siguiente fórmula:


¿Dónde están los promedios aritméticos de las muestras comparadas? t 1, t 2: errores de representatividad identificados con base en los indicadores de las muestras comparadas.

2. La práctica en la FCC ha demostrado que para el trabajo deportivo basta con aceptar la fiabilidad de la cuenta P = 0,95.

Para la confiabilidad del conteo: P = 0,95 (a = 0,05), con el número de grados de libertad

k = n 1 + n 2 - 2 usando la tabla del Apéndice 4 encontramos el valor del valor límite del criterio ( t gr).

3. Con base en las propiedades de la ley de distribución normal, el criterio de Student compara t y t gr.

Sacamos conclusiones:

si t t gr, entonces la diferencia entre las muestras comparadas es estadísticamente significativa;

si t t gr, entonces la diferencia es estadísticamente insignificante.

Para los investigadores en el campo de FCS, evaluar la significación estadística es el primer paso para resolver un problema específico: si las muestras que se comparan son fundamentalmente o no fundamentalmente diferentes entre sí. El siguiente paso es evaluar esta diferencia desde un punto de vista pedagógico, que viene determinado por las condiciones de la tarea.

Consideremos la aplicación de la prueba de Student usando un ejemplo específico.

Ejemplo 2.14. Se evaluó la frecuencia cardíaca (lpm) de un grupo de 18 sujetos antes de x i y después y yo calentamiento.

Evaluar la efectividad del calentamiento en función de la frecuencia cardíaca. Los datos iniciales y los cálculos se presentan en la tabla. 2.30 y 2.31.

Tabla 2.30

Procesamiento de indicadores de frecuencia cardíaca antes del calentamiento.


Los errores de ambos grupos coincidieron, ya que los tamaños de muestra fueron iguales (el mismo grupo fue estudiado en diferentes condiciones) y las desviaciones estándar fueron s x = s y = 3 latidos/min. Pasemos a definir la prueba de Student:

Fijamos la fiabilidad de la cuenta: P = 0,95.

Número de grados de libertad k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34. De la tabla del Apéndice 4 encontramos t gr= 2,02.

Inferencia estadística. Dado que t = 11,62 y la frontera t gr = 2,02, entonces 11,62 > 2,02, es decir t > t gr, por lo tanto la diferencia entre las muestras es estadísticamente significativa.

Conclusión pedagógica. Se encontró que en términos de frecuencia cardíaca la diferencia entre el estado del grupo antes y después del calentamiento es estadísticamente significativa, es decir. significativo, fundamental. Entonces, basándonos en el indicador de frecuencia cardíaca, podemos concluir que el calentamiento es efectivo.

Criterio de Fisher es paramétrico. Se utiliza al comparar tasas de dispersión de muestras. Esto suele significar una comparación en términos de estabilidad del rendimiento deportivo o estabilidad de los indicadores funcionales y técnicos en la práctica. cultura Física y deportes. Las muestras pueden ser de diferentes tamaños.

El criterio de Fisher se define en la siguiente secuencia.

1. Encuentre el criterio de Fisher F usando la fórmula


donde , son las varianzas de las muestras comparadas.

Las condiciones del criterio de Fisher estipulan que en el numerador de la fórmula F hay una gran dispersión, es decir el número F es siempre mayor que uno.

Establecemos la confiabilidad del cálculo: P = 0,95 - y determinamos el número de grados de libertad para ambas muestras: k 1 = n 1 - 1, k 2 = n 2 - 1.

Utilizando la tabla del Apéndice 4, encontramos el valor límite del criterio F gramo.

Comparación de los criterios F y F. gramo nos permite formular conclusiones:

si F > F gr, entonces la diferencia entre las muestras es estadísticamente significativa;

si F< F гр, то различие между выборками статически недо­стоверно.

Pongamos un ejemplo específico.

Ejemplo 2.15. Analicemos dos grupos de jugadores de balonmano: xyo (n 1= 16 personas) y y i (n 2 = 18 personas). Estos grupos de deportistas fueron estudiados para el tiempo o los tiempos de despegue al lanzar el balón a la portería.

¿Los indicadores de repulsión son del mismo tipo?

Los datos iniciales y los cálculos básicos se presentan en la tabla. 2,32 y 2,33.

Tabla 2.32

Procesamiento de indicadores de repulsión del primer grupo de jugadores de balonmano.


Definamos el criterio de Fisher:





Según los datos presentados en la tabla del Apéndice 6, encontramos Fgr: Fgr = 2,4

Prestemos atención al hecho de que en la tabla del Apéndice 6 la lista de los números de grados de libertad de dispersión tanto mayor como menor se vuelve más aproximada a medida que nos acercamos a números mayores. Así, el número de grados de libertad de la dispersión mayor sigue en este orden: 8, 9, 10, 11, 12, 14, 16, 20, 24, etc., y la más pequeña: 28, 29, 30, 40. , 50, etc. d.

Esto se explica por el hecho de que a medida que aumenta el tamaño de la muestra, las diferencias en la prueba F disminuyen y es posible utilizar valores tabulares cercanos a los datos originales. Entonces, en el ejemplo 2,15 =17 está ausente y podemos tomar el valor más cercano a él k = 16, del cual obtenemos Fgr = 2,4.

Inferencia estadística. Dado que la prueba de Fisher F= 2,5 > F= 2,4, las muestras son estadísticamente distinguibles.

Conclusión pedagógica. Los valores del tiempo (s) de salida al lanzar el balón a la portería para los jugadores de balonmano de ambos grupos difieren significativamente. Estos grupos deben considerarse diferentes.

Investigaciones futuras deberían revelar la razón de esta diferencia.

Ejemplo 2.20.(sobre la fiabilidad estadística de la muestra ). ¿Ha mejorado la calificación del futbolista si el (los) tiempo(s) desde que se da la señal hasta que se patea el balón al inicio del entrenamiento fue x i y al final y i ?

Los datos iniciales y los cálculos básicos se dan en la tabla. 2,40 y 2,41.

Tabla 2.40

Procesamiento de indicadores de tiempo desde dar una señal hasta golpear la pelota al inicio del entrenamiento.


Determinemos la diferencia entre grupos de indicadores utilizando el criterio de Student:

Con confiabilidad P = 0.95 y grados de libertad k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42, usando la tabla del Apéndice 4 encontramos t gr= 2,02. Dado que t = 8,3 > t gr= 2,02: la diferencia es estadísticamente significativa.

Determinemos la diferencia entre grupos de indicadores utilizando el criterio de Fisher:


Según la tabla del Apéndice 2, con confiabilidad P = 0,95 y grados de libertad k = 22-1 = 21, el valor F gr = 21. Dado que F = 1,53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

Inferencia estadística. Según la media aritmética, la diferencia entre grupos de indicadores es estadísticamente significativa. En términos de dispersión (dispersión), la diferencia entre grupos de indicadores no es estadísticamente confiable.

Conclusión pedagógica. Las calificaciones del futbolista han mejorado significativamente, pero se debe prestar atención a la estabilidad de su testimonio.

Preparándose para el trabajo

Antes de esto trabajo de laboratorio en la disciplina "Metrología deportiva" a todos los estudiantes grupo de estudio es necesario formar equipos de trabajo de 3-4 estudiantes en cada uno, para completar conjuntamente la asignación de trabajo de todos los trabajos de laboratorio.

En preparación para el trabajo Familiarícese con las secciones relevantes de la literatura recomendada (consulte la sección 6 de estas pautas) y las notas de las conferencias. Estudiar los apartados 1 y 2 de este trabajo de laboratorio, así como el trabajo asignado al mismo (apartado 4).

Preparar un formulario de informe en hojas estándar de papel de escribir tamaño A4 y rellénelo con los materiales necesarios para el trabajo.

El informe debe contener :

Pagina del titulo indicando el departamento (UC y TR), grupo de estudio, apellido, nombre, patronímico del estudiante, número y título del trabajo de laboratorio, fecha de su realización, así como apellido, grado académico, título académico y cargo del profesor aceptando el trabajo;

Objetivo del trabajo;

Fórmulas con valores numéricos que explican los resultados intermedios y finales de los cálculos;

Tablas de valores medidos y calculados;

Material gráfico requerido por el encargo;

Breves conclusiones con base en los resultados de cada etapa del trabajo asignado y en general del trabajo realizado.

Todos los gráficos y tablas se dibujan cuidadosamente utilizando herramientas de dibujo. Los símbolos gráficos y alfabéticos convencionales deben cumplir con los GOST. Está permitido preparar un informe utilizando tecnología informática.

Trabajo asignado

Antes de realizar todas las mediciones, cada miembro del equipo debe estudiar las reglas de uso del juego deportivo Dardos que figuran en el Apéndice 7, que son necesarias para llevar a cabo las etapas de investigación siguientes.

Etapa I de la investigación“Estudio de los resultados del acierto al blanco del juego deportivo de Dardos por cada miembro del equipo para el cumplimiento de la ley de distribución normal según el criterio χ 2 Pearson y el criterio tres sigma"

1. medir (probar) su velocidad (personal) y coordinación de acciones, lanzando dardos de 30 a 40 veces a un objetivo circular en el juego de deportes Dardos.

2. Resultados de las mediciones (pruebas) xyo(en vasos) formateado en forma de una serie de variación e ingresado en la tabla 4.1 (columnas, realice todos los cálculos necesarios, complete las tablas necesarias y saque conclusiones apropiadas sobre el cumplimiento de la distribución empírica resultante con la ley de distribución normal, por analogía con cálculos, tablas y conclusiones similares del ejemplo 2.12, que figura en la sección 2 de estas directrices en las páginas 7 a 10.

Tabla 4.1

Correspondencia de la velocidad y coordinación de las acciones de los sujetos con la ley de distribución normal.

No. redondeado
Total

II – etapa de investigación

“Evaluación de los indicadores promedio de la población general de aciertos al objetivo del juego deportivo Dardos de todos los estudiantes del grupo de estudio en base a los resultados de las mediciones de los miembros de un equipo”

Evaluar los indicadores promedio de velocidad y coordinación de acciones de todos los estudiantes del grupo de estudio (según la lista del grupo de estudio en la revista de la clase) en función de los resultados de acertar en el objetivo de Dardos de todos los miembros del equipo, obtenidos en la primera etapa. de investigación de este trabajo de laboratorio.

1. Documentar los resultados de las mediciones de velocidad y coordinación de acciones. al lanzar dardos a un objetivo circular en un juego de deportes Dardos de todos los miembros de su equipo (2 - 4 personas), que representan una muestra de los resultados de las mediciones de la población general (resultados de las mediciones de todos los estudiantes de un grupo de estudio, por ejemplo, 15 personas), inscribiéndolas en la segunda y tercera columnas Tabla 4.2.

Tabla 4.2

Procesamiento de indicadores de rapidez y coordinación de acciones.

miembros de la brigada

No.
Total

En el cuadro 4.2 bajo debe ser entendido , puntuación media igualada (ver resultados del cálculo en la Tabla 4.1) miembros de su equipo ( , obtenido en la primera etapa de la investigación. Se debe notar que, generalmente, La Tabla 4.2 contiene el valor promedio calculado de los resultados de la medición obtenidos por un miembro del equipo en la primera etapa de la investigación. , ya que la probabilidad de que coincidan los resultados de las mediciones de diferentes miembros del equipo es muy pequeña. Entonces, por regla general, los valores en columna Tabla 4.2 para cada fila - igual a 1, A en la línea “Total "columnas" ", se escribe el número de miembros de su equipo.

2. Realice todos los cálculos necesarios para completar la tabla 4.2, así como otros cálculos y conclusiones similares a los cálculos y conclusiones del ejemplo 2.13 que se dan en la segunda sección de este desarrollo metodológico en las páginas 13-14. Se debe tener en cuenta al calcular el error de representatividad. "metro" es necesario utilizar la fórmula 2.4 dada en la página 13 de este desarrollo metodológico, ya que la muestra es pequeña (n, y se conoce el número de elementos de la población general N, y es igual al número de estudiantes del grupo de estudio, según el listado de la revista del grupo de estudio.

III – etapa de investigación

Evaluación de la efectividad del calentamiento según el indicador “Velocidad y coordinación de acciones” por cada miembro del equipo mediante la prueba t de Student

Evaluar la efectividad del calentamiento para el lanzamiento de dardos a la diana del juego deportivo "Dardos", realizado en la primera etapa de investigación de este trabajo de laboratorio, por cada miembro del equipo según el indicador "Velocidad y coordinación de acciones", utilizando el criterio de Student, un criterio paramétrico para la confiabilidad estadística de la ley de distribución empírica con respecto a la ley de distribución normal.

… Total

2. variaciones y RMS , resultados de las mediciones del indicador “Velocidad y coordinación de acciones” en base a los resultados del calentamiento, dado en la tabla 4.3, (ver cálculos similares dados inmediatamente después de la tabla 2.30 del ejemplo 2.14 en la página 16 de este desarrollo metodológico).

3. Cada miembro del equipo de trabajo. medir (probar) su velocidad (personal) y coordinación de acciones después del calentamiento,

… Total

5. Realizar cálculos promedio variaciones y RMS ,resultados de las mediciones del indicador “Velocidad y coordinación de acciones” después del calentamiento, dado en la tabla 4.4, anote el resultado general de la medición basándose en los resultados del calentamiento (ver cálculos similares dados inmediatamente después de la tabla 2.31 del ejemplo 2.14 en la página 17 de este desarrollo metodológico).

6. Realice todos los cálculos y conclusiones necesarios similares a los cálculos y conclusiones del ejemplo 2.14 que figuran en la segunda sección de este desarrollo metodológico en las páginas 16-17. Se debe tener en cuenta al calcular el error de representatividad. "metro" es necesario utilizar la fórmula 2.1 dada en la página 12 de este desarrollo metodológico, ya que la muestra es n y se desconoce el número de elementos de la población N (.

IV – etapa de investigación

Evaluación de la uniformidad (estabilidad) de los indicadores “Rapidez y coordinación de acciones” de dos miembros del equipo utilizando el criterio de Fisher

Evaluar la uniformidad (estabilidad) de los indicadores “Rapidez y coordinación de acciones” de dos miembros del equipo utilizando el criterio de Fisher, con base en los resultados de medición obtenidos en la tercera etapa de la investigación en este trabajo de laboratorio.

Para hacer esto necesitas hacer lo siguiente.

Utilizando los datos de las tablas 4.3 y 4.4, los resultados del cálculo de las varianzas de estas tablas obtenidos en la tercera etapa de la investigación, así como la metodología para calcular y aplicar el criterio de Fisher para evaluar la uniformidad (estabilidad) de los indicadores deportivos, dados en ejemplo 2.15 en las páginas 18-19 de este desarrollo metodológico, extraiga conclusiones estadísticas y pedagógicas apropiadas.

V – etapa de investigación

Evaluación de grupos de indicadores “Rapidez y coordinación de acciones” de un miembro del equipo antes y después del calentamiento

FUNCIÓN PAGO. La característica de significación estadística sólo está disponible en algunos planes tarifarios. Comprueba si está dentro.

Podrás averiguar si existen diferencias estadísticamente significativas en las respuestas recibidas de diferentes grupos encuestados a las preguntas de la encuesta. Para utilizar la función de significancia estadística en SurveyMonkey, debes:

  • Habilite la función de significación estadística al agregar una regla de comparación a una pregunta de su encuesta. Seleccione grupos de encuestados para compararlos y ordenar los resultados de la encuesta en grupos para realizar una comparación visual.
  • Examine las tablas con datos sobre las preguntas de su encuesta para identificar la presencia de estadísticas. diferencias significativas en las respuestas recibidas de diferentes grupos de encuestados.

Ver significación estadística

Si sigue los pasos a continuación, puede crear una encuesta que muestre significación estadística.

1. Agregue preguntas cerradas a su encuesta

Para mostrar significancia estadística al analizar los resultados, deberá aplicar una regla de comparación a cualquier pregunta de su encuesta.

Puede aplicar la regla de comparación y calcular la significancia estadística de las respuestas si utiliza uno de los siguientes en el diseño de su encuesta: siguientes tipos preguntas:

Es necesario asegurarse de que las opciones de respuesta propuestas se puedan dividir en grupos completos. Las opciones de respuesta que seleccione para comparar cuando cree una regla de comparación se utilizarán para organizar los datos en tablas cruzadas a lo largo de la encuesta.

2. Recoge respuestas

Una vez que haya completado su encuesta, cree un recopilador para distribuirla. Hay varias maneras.

Debe recibir al menos 30 respuestas para cada opción de respuesta que planee usar en su regla de comparación para activar y ver la significancia estadística.

Ejemplo de encuesta

Quiere saber si los hombres están significativamente más satisfechos con sus productos que las mujeres.

  1. Agregue dos preguntas de opción múltiple a su encuesta:
    ¿Cuál es su género? (Macho femenino)
    ¿Está satisfecho o insatisfecho con nuestro producto? (satisfecho, insatisfecho)
  2. Asegúrese de que al menos 30 encuestados seleccionen "masculino" para la pregunta de género Y al menos 30 encuestados seleccionen "femenino" como género.
  3. Agregue una regla de comparación a la pregunta "¿Cuál es su género?" y seleccione ambas opciones de respuesta según sus grupos.
  4. Utilice la tabla de datos debajo del cuadro de preguntas "¿Está satisfecho o insatisfecho con nuestro producto?" para ver si alguna opción de respuesta muestra una diferencia estadísticamente significativa

¿Qué es una diferencia estadísticamente significativa?

Una diferencia estadísticamente significativa significa que el análisis estadístico ha determinado que existen diferencias significativas entre las respuestas de un grupo de encuestados y las respuestas de otro grupo. La significación estadística significa que los números obtenidos son significativamente diferentes. Este conocimiento le será de gran ayuda en el análisis de datos. Sin embargo, usted determina la importancia de los resultados obtenidos. Eres tú quien decide cómo interpretar los resultados de la encuesta y qué acciones se deben tomar en base a ellos.

Por ejemplo, recibe más quejas de clientas que de clientes masculinos. ¿Cómo podemos determinar si esa diferencia es real y si es necesario tomar medidas al respecto? Una excelente manera de probar tus observaciones es realizar una encuesta que te mostrará si los clientes masculinos están significativamente más satisfechos con tu producto. Utilizando una fórmula estadística, nuestra función de significación estadística le permitirá determinar si su producto es realmente mucho más atractivo para los hombres que para las mujeres. Esto le permitirá tomar medidas basadas en hechos en lugar de conjeturas.

Diferencia estadísticamente significativa

Si sus resultados están resaltados en la tabla de datos, significa que los dos grupos de encuestados son significativamente diferentes entre sí. El término "significativo" no significa que los números resultantes tengan ninguna importancia o significado particular, sólo que existe una diferencia estadística entre ellos.

Ninguna diferencia estadísticamente significativa

Si sus resultados no están resaltados en la tabla de datos correspondiente, esto significa que, aunque puede haber una diferencia en las dos cifras que se comparan, no existe una diferencia estadística entre ellas.

Las respuestas sin diferencias estadísticamente significativas demuestran que no hay diferencias significativas entre los dos elementos que se comparan dado el tamaño de la muestra que se utiliza, pero esto no significa necesariamente que no sean significativas. Quizás al aumentar el tamaño de la muestra se pueda identificar una diferencia estadísticamente significativa.

Tamaño de la muestra

Si tiene un tamaño de muestra muy pequeño, sólo muy grandes diferencias entre dos grupos. Si tiene un tamaño de muestra muy grande, tanto las diferencias pequeñas como las grandes se considerarán significativas.

Sin embargo, si dos números son estadísticamente diferentes, esto no significa que la diferencia entre los resultados tenga algún significado práctico para usted. Tendrá que decidir usted mismo qué diferencias son significativas para su encuesta.

Calcular la importancia estadística

Calculamos la significación estadística utilizando un nivel de confianza estándar del 95%. Si una opción de respuesta se muestra como estadísticamente significativa, significa que solo por casualidad o debido a un error de muestreo hay menos del 5% de probabilidad de que ocurra la diferencia entre los dos grupos (a menudo se muestra como: p<0,05).

Para calcular diferencias estadísticamente significativas entre grupos, utilizamos las siguientes fórmulas:

Parámetro

Descripción

a1El porcentaje de participantes del primer grupo que respondieron la pregunta de cierta manera, multiplicado por el tamaño de la muestra de este grupo.
b1El porcentaje de participantes del segundo grupo que respondieron la pregunta de cierta manera, multiplicado por el tamaño de la muestra de este grupo.
Proporción de muestra agrupada (p)La combinación de dos acciones de ambos grupos.
Error estándar (SE)Un indicador de en qué medida su participación difiere de la participación real. Un valor más bajo significa que la fracción está cerca de la fracción real, un valor más alto significa que la fracción es significativamente diferente de la fracción real.
Estadístico de prueba (t)Estadística de prueba. El número de desviaciones estándar en las que un valor dado difiere de la media.
Significancia estadísticaSi el valor absoluto del estadístico de prueba es mayor que 1,96* desviaciones estándar de la media, se considera una diferencia estadísticamente significativa.

*1,96 es el valor utilizado para el nivel de confianza del 95% porque el 95% del rango manejado por la función de distribución t de Student se encuentra dentro de 1,96 desviaciones estándar de la media.

Ejemplo de cálculo

Siguiendo con el ejemplo anterior, averigüemos si el porcentaje de hombres que dicen estar satisfechos con su producto es significativamente mayor que el porcentaje de mujeres.

Digamos que 1000 hombres y 1000 mujeres participaron en su encuesta y el resultado de la encuesta fue que el 70% de los hombres y el 65% de las mujeres dicen que están satisfechos con su producto. ¿El nivel del 70% es significativamente mayor que el nivel del 65%?

Sustituya los siguientes datos de la encuesta en las fórmulas dadas:

  • p1 (% de hombres satisfechos con el producto) = 0,7
  • p2 (% de mujeres satisfechas con el producto) = 0,65
  • n1 (número de hombres encuestados) = 1000
  • n2 (número de mujeres entrevistadas) = ​​1000

Dado que el valor absoluto del estadístico de prueba es mayor que 1,96, significa que la diferencia entre hombres y mujeres es significativa. En comparación con las mujeres, los hombres tienen más probabilidades de estar satisfechos con su producto.

Ocultar significación estadística

Cómo ocultar la significación estadística para todas las preguntas

  1. Haga clic en la flecha hacia abajo a la derecha de la regla de comparación en la barra lateral izquierda.
  2. selecciona un artículo Editar regla.
  3. Deshabilitar la función Mostrar significación estadística usando un interruptor.
  4. Clic en el botón Aplicar.

Para ocultar la significación estadística de una pregunta, debe:

  1. Clic en el botón Melodía encima del diagrama de este número.
  2. Abre la pestaña opciones de pantalla.
  3. Desmarque la casilla junto a Significancia estadística.
  4. Clic en el botón Ahorrar.

La opción de visualización se habilita automáticamente cuando se habilita la visualización de significación estadística. Si desactiva esta opción de visualización, la visualización de significación estadística también se desactivará.

Active la función de significancia estadística cuando agregue una regla de comparación a una pregunta de su encuesta. Examine las tablas de datos de las preguntas de su encuesta para determinar si existen diferencias estadísticamente significativas en las respuestas recibidas de diferentes grupos de encuestados.