นัยสำคัญทางสถิติ

ผลลัพธ์ที่ได้โดยใช้ขั้นตอนการวิจัยเฉพาะเรียกว่า มีนัยสำคัญทางสถิติหากความน่าจะเป็นของการเกิดขึ้นแบบสุ่มมีน้อยมาก แนวคิดนี้สามารถอธิบายได้ด้วยตัวอย่างการโยนเหรียญ สมมติว่าโยนเหรียญ 30 ครั้ง; หัวขึ้นมา 17 ครั้ง และก้อยขึ้นมา 13 ครั้ง เป็น สำคัญการเบี่ยงเบนของผลลัพธ์นี้ไปจากที่คาดไว้ (15 หัวและ 15 ก้อย) หรือการเบี่ยงเบนนี้เป็นแบบสุ่ม? เพื่อตอบคำถามนี้ คุณสามารถโยนเหรียญเดียวกันหลาย ๆ ครั้ง 30 ครั้งติดต่อกัน และในเวลาเดียวกันให้สังเกตว่าอัตราส่วนของ "หัว" ต่อ "ก้อย" ของ 17:13 ซ้ำกี่ครั้ง การวิเคราะห์ทางสถิติช่วยเราจากกระบวนการที่น่าเบื่อนี้ ด้วยความช่วยเหลือนี้ หลังจากการโยนเหรียญ 30 ครั้งแรก คุณสามารถประมาณจำนวนสุ่มที่เป็นไปได้ของ "หัว" 17 อันและ "ก้อย" 13 อัน การประเมินดังกล่าวเรียกว่าข้อความความน่าจะเป็น

ใน วรรณกรรมทางวิทยาศาสตร์ในทางจิตวิทยาอุตสาหกรรม-องค์กร ข้อความความน่าจะเป็นในรูปแบบทางคณิตศาสตร์จะแสดงด้วยนิพจน์ ร(ความน่าจะเป็น)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (หน้า< 0.01) ข้อเท็จจริงนี้มีความสำคัญต่อการทำความเข้าใจวรรณกรรม แต่ไม่ควรหมายความว่าการสังเกตที่ไม่เป็นไปตามมาตรฐานเหล่านี้ไม่มีประโยชน์ ที่เรียกว่าผลการวิจัยที่ไม่มีนัยสำคัญ (ข้อสังเกตที่ได้มาโดยบังเอิญ) มากกว่า 1-5 ครั้งจากทั้งหมด 100 ครั้ง) จะมีประโยชน์มากในการระบุแนวโน้มและเป็นแนวทางในการวิจัยในอนาคต

ควรสังเกตด้วยว่านักจิตวิทยาบางคนไม่เห็นด้วยกับมาตรฐานและขั้นตอนปฏิบัติแบบดั้งเดิม (เช่น Cohen, 1994; Sauley & Bedeian, 1989) ปัญหาการวัดก็อยู่ที่ตัวเอง ธีมหลักงานของนักวิจัยหลายคนศึกษาความแม่นยำของวิธีการวัดและสถานที่ที่รองรับ วิธีการที่มีอยู่และมาตรฐานตลอดจนการพัฒนาแพทย์และเครื่องมือใหม่ๆ บางทีในอนาคต การวิจัยในด้านอำนาจนี้อาจนำไปสู่การเปลี่ยนแปลงมาตรฐานดั้งเดิมในการประเมินนัยสำคัญทางสถิติ และการเปลี่ยนแปลงเหล่านี้จะได้รับการยอมรับอย่างกว้างขวาง (ส่วนที่ห้าของสมาคมจิตวิทยาอเมริกันคือกลุ่มนักจิตวิทยาที่เชี่ยวชาญด้านการศึกษาการประเมิน การวัด และสถิติ)

ในรายงานการวิจัย ข้อความความน่าจะเป็น เช่น ร< 0.05 เนื่องจากบางส่วน สถิติ,นั่นคือตัวเลขที่ได้รับจากขั้นตอนการคำนวณทางคณิตศาสตร์ชุดหนึ่ง การยืนยันความน่าจะเป็นนั้นได้มาโดยการเปรียบเทียบสถิติเหล่านี้กับข้อมูลจากตารางพิเศษที่เผยแพร่เพื่อจุดประสงค์นี้ ในการวิจัยทางจิตวิทยาอุตสาหกรรม-องค์กร สถิติต่างๆ เช่น r, F, t, r>(อ่านว่า “ไคสแควร์”) และ ร(อ่านว่า "พหูพจน์" ร").ในแต่ละกรณี สถิติ (ตัวเลขหนึ่งตัว) ที่ได้จากการวิเคราะห์ชุดข้อสังเกตสามารถนำมาเปรียบเทียบกับตัวเลขจากตารางที่เผยแพร่ได้ หลังจากนี้ คุณสามารถกำหนดข้อความความน่าจะเป็นเกี่ยวกับความน่าจะเป็นที่จะได้ตัวเลขนี้แบบสุ่ม นั่นคือสรุปเกี่ยวกับความสำคัญของการสังเกต

เพื่อให้เข้าใจการศึกษาที่อธิบายไว้ในหนังสือเล่มนี้ ก็เพียงพอแล้วที่จะมีความเข้าใจที่ชัดเจนเกี่ยวกับแนวคิดเรื่องนัยสำคัญทางสถิติ และไม่จำเป็นต้องรู้ว่าสถิติที่กล่าวมาข้างต้นคำนวณอย่างไร อย่างไรก็ตาม มันจะเป็นประโยชน์ที่จะหารือเกี่ยวกับสมมติฐานข้อหนึ่งที่อยู่ภายใต้ขั้นตอนเหล่านี้ทั้งหมด นี่คือสมมติฐานที่ว่าตัวแปรที่สังเกตได้ทั้งหมดมีการกระจายแบบปกติโดยประมาณ นอกจากนี้ เมื่ออ่านรายงานการวิจัยทางจิตวิทยาขององค์กรอุตสาหกรรม แนวคิดอื่นอีกสามประการมักจะเจอกับบทละครนั้น บทบาทที่สำคัญ- ประการแรก สหสัมพันธ์ และ การเชื่อมต่อความสัมพันธ์ประการที่สอง ตัวแปรดีเทอร์มิแนนต์/ตัวทำนายและ ANOVA ( การวิเคราะห์ความแปรปรวน) ประการที่สาม กลุ่มวิธีการทางสถิติภายใต้ ชื่อสามัญ"การวิเคราะห์เมตา"

ลองพิจารณาตัวอย่างทั่วไปของการใช้วิธีการทางสถิติในการแพทย์ ผู้สร้างยาแนะนำให้เพิ่มการขับปัสสาวะตามสัดส่วนของขนาดยาที่ได้รับ เพื่อทดสอบสมมติฐานนี้ พวกเขาให้อาสาสมัคร 5 คนในขนาดยาที่แตกต่างกัน

จากผลการสังเกต กราฟของการขับปัสสาวะเทียบกับขนาดยาจะถูกพล็อต (รูปที่ 1.2A) การพึ่งพาอาศัยกันสามารถมองเห็นได้ด้วยตาเปล่า นักวิจัยแสดงความยินดีกับการค้นพบนี้และโลกของยาขับปัสสาวะชนิดใหม่

ในความเป็นจริง ข้อมูลช่วยให้เราระบุได้อย่างน่าเชื่อถือว่าอาสาสมัครทั้งห้าคนนี้มีการขับปัสสาวะตามขนาดยา ความจริงที่ว่าการพึ่งพาอาศัยกันนี้จะปรากฏในทุกคนที่เสพยานั้นไม่มีอะไรมากไปกว่าข้อสันนิษฐาน
จี

กับ

ชีวิต ไม่สามารถพูดได้ว่ามันไม่มีโคมลอย - ไม่เช่นนั้นทำไมต้องทำการทดลอง?

แต่ยาก็ขายไป ทั้งหมด ผู้คนมากขึ้นรับไปโดยหวังว่าจะเพิ่มการปัสสาวะออก แล้วเราเห็นอะไร? เราเห็นรูปที่ 1.2B ซึ่งบ่งชี้ว่าไม่มีความเชื่อมโยงระหว่างขนาดยากับการขับปัสสาวะ วงกลมสีดำบ่งบอกถึงข้อมูลจากการศึกษาต้นฉบับ สถิติมีวิธีการที่ช่วยให้เราประเมินความเป็นไปได้ที่จะได้รับตัวอย่างที่ "ไม่ได้เป็นตัวแทน" และทำให้เกิดความสับสนอย่างแท้จริง ปรากฎว่าหากไม่มีความสัมพันธ์ระหว่างการขับปัสสาวะกับขนาดยา จะสังเกต "การพึ่งพา" ที่เกิดขึ้นในการทดลองประมาณ 5 จาก 1,000 ครั้ง ดังนั้น ในกรณีนี้ นักวิจัยโชคไม่ดีเลย แม้ว่าพวกเขาจะใช้วิธีการทางสถิติขั้นสูงสุด แต่ก็ยังไม่สามารถป้องกันพวกเขาจากการทำผิดพลาดได้

เราให้ตัวอย่างที่สมมติขึ้นนี้ แต่ไม่ไกลจากความเป็นจริงเลย โดยไม่ชี้ให้เห็นถึงความไร้ประโยชน์
ความเป็นมาของสถิติ เขาพูดถึงเรื่องอื่นเกี่ยวกับลักษณะความน่าจะเป็นของข้อสรุปของเธอ จากการใช้วิธีการทางสถิติ เราไม่ได้รับความจริงขั้นสุดท้าย แต่เป็นเพียงการประมาณความน่าจะเป็นของสมมติฐานเฉพาะเท่านั้น นอกจากนี้ วิธีการทางสถิติแต่ละวิธียังขึ้นอยู่กับวิธีการทางสถิติของตัวเองอีกด้วย แบบจำลองทางคณิตศาสตร์และผลลัพธ์ก็ถูกต้องจนโมเดลนี้สอดคล้องกับความเป็นจริง

เพิ่มเติมในหัวข้อความน่าเชื่อถือและความสำคัญทางสถิติ:

ความแตกต่างที่มีนัยสำคัญทางสถิติในตัวชี้วัดคุณภาพชีวิต
ประชากรทางสถิติ ลักษณะทางบัญชี แนวคิดการวิจัยต่อเนื่องและคัดเลือก ข้อกำหนดสำหรับข้อมูลทางสถิติและการใช้เอกสารทางบัญชีและการรายงาน
เชิงนามธรรม. การศึกษาความน่าเชื่อถือของตัวชี้วัด TONOMETER สำหรับการวัดความดันภายในลูกตาผ่านเปลือกตา 2561, 2561

ในสถานการณ์ทางวิทยาศาสตร์และการปฏิบัติของการทดลอง (แบบสำรวจ) นักวิจัยสามารถศึกษาได้ไม่ใช่ทุกคน (ประชากรทั่วไป ประชากร) แต่จะศึกษาเพียงตัวอย่างบางส่วนเท่านั้น ตัวอย่างเช่น แม้ว่าเราจะศึกษาคนกลุ่มเล็กๆ เช่น ผู้ที่เป็นโรคเฉพาะเจาะจง แต่ก็ยังไม่น่าเป็นไปได้ที่เราจะมีทรัพยากรที่เหมาะสมหรือไม่จำเป็นต้องทดสอบผู้ป่วยทุกราย แต่เป็นเรื่องปกติที่จะทดสอบตัวอย่างจากประชากรแทน เนื่องจากสะดวกกว่าและใช้เวลาน้อยกว่า ถ้าเป็นเช่นนั้นเราจะรู้ได้อย่างไรว่าผลลัพธ์ที่ได้จากกลุ่มตัวอย่างเป็นตัวแทนของทั้งกลุ่ม? หรือหากต้องการใช้คำศัพท์เฉพาะทาง เราจะแน่ใจได้อย่างไรว่างานวิจัยของเราจะอธิบายเนื้อหาทั้งหมดได้อย่างถูกต้อง ประชากรตัวอย่างที่เราใช้?

เพื่อตอบคำถามนี้ จำเป็นต้องกำหนดนัยสำคัญทางสถิติของผลการทดสอบ นัยสำคัญทางสถิติ (ระดับสำคัญ, ย่อ ซิก)หรือ /7-ระดับนัยสำคัญ (ระดับ p) -คือความน่าจะเป็นนั้น ผลลัพธ์นี้แสดงถึงประชากรที่สุ่มตัวอย่างการศึกษาอย่างถูกต้อง โปรดทราบว่านี่เป็นเพียง ความน่าจะเป็น- เป็นไปไม่ได้ที่จะพูดด้วยการรับประกันอย่างแน่นอน การศึกษาครั้งนี้อธิบายประชากรทั้งหมดได้อย่างถูกต้อง ระดับนัยสำคัญสามารถสรุปได้ว่ามีความเป็นไปได้สูง จึงเกิดขึ้นอย่างหลีกเลี่ยงไม่ได้ คำถามถัดไป: ต้องมีความสำคัญระดับใดจึงจะถือว่าผลลัพธ์นี้เป็นลักษณะที่ถูกต้องของประชากรได้

ตัวอย่างเช่น คุณยินดีที่จะบอกว่าโอกาสดังกล่าวเพียงพอที่จะรับความเสี่ยงที่ค่าความน่าจะเป็นเท่าใด จะเกิดอะไรขึ้นถ้าอัตราต่อรองคือ 10 จาก 100 หรือ 50 จาก 100? จะเกิดอะไรขึ้นถ้าความน่าจะเป็นนี้สูงกว่า? แล้วอัตราต่อรองเช่น 90 จาก 100, 95 จาก 100 หรือ 98 จาก 100 ล่ะ? สำหรับสถานการณ์ที่เกี่ยวข้องกับความเสี่ยง ทางเลือกนี้ค่อนข้างเป็นปัญหาเนื่องจากขึ้นอยู่กับลักษณะส่วนบุคคลของบุคคล

ในทางจิตวิทยา เชื่อกันว่าโอกาส 95 หรือมากกว่าใน 100 หมายความว่าความน่าจะเป็นของผลลัพธ์ที่ถูกต้องนั้นสูงพอที่จะทำให้ประชากรทั้งหมดสามารถสรุปได้ทั่วไป ตัวเลขนี้ก่อตั้งขึ้นในกระบวนการของกิจกรรมทางวิทยาศาสตร์และการปฏิบัติ - ไม่มีกฎหมายที่ควรเลือกเป็นแนวทาง (และแน่นอนว่าในวิทยาศาสตร์อื่นบางครั้งค่าอื่น ๆ ของระดับนัยสำคัญก็ถูกเลือก)

ในทางจิตวิทยา พวกเขาดำเนินการด้วยความน่าจะเป็นนี้หลายครั้ง ในลักษณะที่ไม่ธรรมดา- แทนที่จะเป็นความน่าจะเป็นที่กลุ่มตัวอย่างแสดงถึงประชากร ความน่าจะเป็นที่กลุ่มตัวอย่าง ไม่ได้เป็นตัวแทนประชากร. กล่าวอีกนัยหนึ่ง คือความน่าจะเป็นที่ความสัมพันธ์หรือความแตกต่างที่สังเกตได้นั้นเป็นแบบสุ่มและไม่ใช่สมบัติของประชากร ดังนั้น แทนที่จะบอกว่ามีโอกาส 95 ใน 100 ที่ผลการศึกษาถูกต้อง นักจิตวิทยากลับบอกว่ามีโอกาส 5 ใน 100 ที่ผลการศึกษาจะผิด (เช่นเดียวกับโอกาส 40 ใน 100 ที่ผลการศึกษาจะถูกต้องก็หมายความว่า มีโอกาส 60 ใน 100 ที่จะสนับสนุนความผิดพลาด) บางครั้งค่าความน่าจะเป็นจะแสดงเป็นเปอร์เซ็นต์ แต่มักจะเขียนเป็น ทศนิยม- ตัวอย่างเช่น โอกาส 10 ใน 100 จะแสดงเป็นเศษส่วนทศนิยม 0.1 5 จาก 100 เขียนเป็น 0.05; 1 จาก 100 - 0.01 ด้วยรูปแบบการบันทึกนี้ ค่าขีดจำกัดคือ 0.05 ผลที่จะถือว่าถูกต้องจะต้องมีระดับนัยสำคัญ ด้านล่างตัวเลขนี้ (จำไว้ว่านี่คือความน่าจะเป็นที่ผลลัพธ์ ผิดอธิบายถึงประชากร) เพื่อขจัดคำศัพท์ เราจะเพิ่มว่า "ความน่าจะเป็นของผลลัพธ์ที่ไม่ถูกต้อง" (ซึ่งเรียกได้ถูกต้องกว่า ระดับนัยสำคัญ)มักจะแสดงแทน อักษรละติน ร.คำอธิบายของผลการทดลองมักจะมีข้อความสรุป เช่น “ผลลัพธ์มีนัยสำคัญที่ระดับความเชื่อมั่น” (หน้า(p) น้อยกว่า 0.05 (เช่น น้อยกว่า 5%)

ดังนั้นระดับนัยสำคัญ ( ร) บ่งบอกถึงความน่าจะเป็นของผลลัพธ์ ไม่เป็นตัวแทนของประชากร ตามเนื้อผ้าในด้านจิตวิทยาเชื่อกันว่าผลลัพธ์สะท้อนได้อย่างน่าเชื่อถือ ภาพใหญ่ถ้ามีค่า รน้อยกว่า 0.05 (เช่น 5%) อย่างไรก็ตาม นี่เป็นเพียงข้อความแสดงความน่าจะเป็นเท่านั้น และไม่ใช่การรับประกันแบบไม่มีเงื่อนไขแต่อย่างใด ในบางกรณีข้อสรุปนี้อาจไม่ถูกต้อง ในความเป็นจริง เราสามารถคำนวณได้ว่าเหตุการณ์นี้อาจเกิดขึ้นได้บ่อยเพียงใดหากเราพิจารณาขนาดของระดับนัยสำคัญ ที่ระดับนัยสำคัญ 0.05 ผลลัพธ์ 5 ใน 100 ครั้งมีแนวโน้มที่จะไม่ถูกต้อง เมื่อมองแวบแรก 11a ดูเหมือนว่านี่จะไม่ธรรมดานัก แต่ถ้าคุณคิดดูดีๆ โอกาส 5 ใน 100 ก็เท่ากับ 1 ใน 20 หรืออีกนัยหนึ่ง หนึ่งในทุกๆ 20 กรณีผลลัพธ์จะเป็น ไม่ถูกต้อง. โอกาสดังกล่าวดูเหมือนจะไม่ค่อยดีนัก และนักวิจัยควรระวังในการดำเนินการ ข้อผิดพลาดประเภทแรกนี่คือชื่อของข้อผิดพลาดที่เกิดขึ้นเมื่อนักวิจัยคิดว่าพบผลลัพธ์ที่แท้จริงแล้ว แต่ในความเป็นจริงกลับไม่พบ ข้อผิดพลาดตรงกันข้ามซึ่งประกอบด้วยนักวิจัยที่เชื่อว่าไม่พบผลลัพธ์เมื่อมีอยู่จริงเรียกว่า ข้อผิดพลาดประเภทที่สอง

ข้อผิดพลาดเหล่านี้เกิดขึ้นเนื่องจากความเป็นไปได้ที่การวิเคราะห์ทางสถิติดำเนินการไม่สามารถตัดออกได้ ความน่าจะเป็นของข้อผิดพลาดขึ้นอยู่กับระดับนัยสำคัญทางสถิติของผลลัพธ์ เราได้สังเกตแล้วว่าเพื่อให้พิจารณาผลลัพธ์ที่ถูกต้อง ระดับนัยสำคัญต้องต่ำกว่า 0.05 แน่นอนว่าผลลัพธ์บางอย่างมากกว่านั้น ระดับต่ำและไม่ใช่เรื่องแปลกที่จะพบผลลัพธ์ที่ต่ำถึง 0.001 (ค่า 0.001 บ่งชี้ว่าผลลัพธ์มีโอกาสผิดพลาด 1 ใน 1,000) ยังไง มูลค่าน้อยลง p ยิ่งเรามั่นใจในความถูกต้องของผลลัพธ์มากขึ้นเท่านั้น

ในตาราง 7.2 แสดงการตีความระดับนัยสำคัญแบบดั้งเดิมเกี่ยวกับความเป็นไปได้ของการอนุมานทางสถิติและเหตุผลในการตัดสินใจเกี่ยวกับการมีความสัมพันธ์ (ความแตกต่าง)

ตารางที่ 7.2

การตีความระดับนัยสำคัญที่ใช้ในจิตวิทยาแบบดั้งเดิม

ขอแนะนำจากประสบการณ์การวิจัยเชิงปฏิบัติ: เพื่อหลีกเลี่ยงข้อผิดพลาดประเภทที่หนึ่งและสองให้มากที่สุดเมื่อทำการสรุปที่สำคัญควรทำการตัดสินใจเกี่ยวกับการมีความแตกต่าง (การเชื่อมต่อ) โดยเน้นที่ระดับ รเครื่องหมายไม่มี

การทดสอบทางสถิติ(การทดสอบทางสถิติ -เป็นเครื่องมือในการกำหนดระดับนัยสำคัญทางสถิติ นี่เป็นกฎชี้ขาดที่ทำให้แน่ใจว่าสมมติฐานที่แท้จริงได้รับการยอมรับ และสมมติฐานเท็จจะถูกปฏิเสธด้วยความน่าจะเป็นสูง

เกณฑ์ทางสถิติยังแสดงถึงวิธีการคำนวณจำนวนหนึ่งและจำนวนนั้นด้วย เกณฑ์ทั้งหมดใช้เพื่อวัตถุประสงค์หลักประการเดียว: เพื่อกำหนด ระดับนัยสำคัญข้อมูลที่พวกเขาวิเคราะห์ (เช่น ความน่าจะเป็นที่ข้อมูลจะสะท้อนถึงผลกระทบที่แท้จริงซึ่งแสดงถึงประชากรที่ใช้สุ่มตัวอย่างอย่างถูกต้อง)

การทดสอบบางอย่างสามารถใช้ได้เฉพาะกับข้อมูลที่แจกแจงแบบปกติเท่านั้น (และหากลักษณะถูกวัดเป็นช่วง) การทดสอบเหล่านี้มักจะเรียกว่า พารามิเตอร์เมื่อใช้เกณฑ์อื่นคุณสามารถวิเคราะห์ข้อมูลได้เกือบทุกกฎหมายการกระจาย - เรียกว่า ไม่ใช่พารามิเตอร์

เกณฑ์พาราเมตริกคือเกณฑ์ที่รวมพารามิเตอร์การกระจายไว้ในสูตรการคำนวณ เช่น ค่าเฉลี่ยและความแปรปรวน (การทดสอบของนักเรียน, การทดสอบ F ของฟิชเชอร์ ฯลฯ )

เกณฑ์ที่ไม่ใช่พารามิเตอร์คือเกณฑ์ที่ไม่รวมพารามิเตอร์การกระจายในสูตรสำหรับการคำนวณพารามิเตอร์การกระจาย และขึ้นอยู่กับการทำงานกับความถี่หรืออันดับ (เกณฑ์ ถามเกณฑ์ Rosenbaum คุณมานา-วิทนีย์

ตัวอย่างเช่น เมื่อเราบอกว่าความสำคัญของความแตกต่างถูกกำหนดโดยการทดสอบทีของนักเรียน เราหมายถึงว่าวิธีการทดสอบทีของนักเรียนนั้นใช้ในการคำนวณค่าเชิงประจักษ์ ซึ่งจากนั้นจะถูกนำไปเปรียบเทียบกับค่าในตาราง (วิกฤต)

ด้วยอัตราส่วนของเชิงประจักษ์ (คำนวณโดยเรา) และค่าวิกฤตของเกณฑ์ (ตาราง) เราสามารถตัดสินได้ว่าสมมติฐานของเราได้รับการยืนยันหรือหักล้างหรือไม่ ในกรณีส่วนใหญ่ เพื่อให้เรารับรู้ถึงความแตกต่างที่มีนัยสำคัญ จำเป็นที่ค่าเชิงประจักษ์ของเกณฑ์จะต้องมากกว่าค่าวิกฤติ แม้ว่าจะมีเกณฑ์ (เช่น การทดสอบแมนน์-วิทนีย์ หรือการทดสอบเครื่องหมาย) ซึ่ง เราต้องปฏิบัติตามกฎที่ตรงกันข้าม

ในบางกรณี สูตรการคำนวณสำหรับเกณฑ์จะรวมจำนวนการสังเกตในกลุ่มตัวอย่างที่กำลังศึกษาด้วย แสดงเป็น พี เมื่อใช้ตารางพิเศษ เราจะพิจารณาว่าระดับนัยสำคัญทางสถิติของความแตกต่างซึ่งค่าเชิงประจักษ์ที่กำหนดนั้นสอดคล้องกับระดับใด ในกรณีส่วนใหญ่ ค่าเชิงประจักษ์ที่เท่ากันของเกณฑ์อาจมีนัยสำคัญหรือไม่มีนัยสำคัญ ขึ้นอยู่กับจำนวนการสังเกตในกลุ่มตัวอย่างภายใต้การศึกษา ( n ) หรือจากสิ่งที่เรียกว่า จำนวนองศาอิสระ ซึ่งแสดงเป็น โวลต์ (g>) หรืออย่างไร df (บางครั้ง ง)

รู้ nหรือจำนวนระดับความเป็นอิสระโดยใช้ตารางพิเศษ (ตารางหลักได้รับในภาคผนวก 5) เราสามารถกำหนดค่าวิกฤตของเกณฑ์และเปรียบเทียบค่าเชิงประจักษ์ที่ได้รับกับค่าเหล่านั้น โดยปกติจะเขียนดังนี้: “เมื่อใด” น=ค่าวิกฤต 22 ค่าของเกณฑ์คือ เสื้อ เซนต์ = 2.07" หรือ "ที่ โวลต์ (ง) = ค่าวิกฤต 2 ค่าของแบบทดสอบของนักเรียนคือ = 4.30” เป็นต้น

โดยทั่วไปแล้ว การตั้งค่าจะยังคงเป็นไปตามเกณฑ์แบบพาราเมตริก และเรายึดถือตำแหน่งนี้ ถือว่ามีความน่าเชื่อถือมากกว่าและสามารถให้ข้อมูลและการวิเคราะห์เชิงลึกได้มากขึ้น ส่วนความซับซ้อนของการคำนวณทางคณิตศาสตร์เมื่อใช้ โปรแกรมคอมพิวเตอร์ความยากลำบากนี้หายไป (แต่บางส่วนก็ปรากฏว่าสามารถเอาชนะได้)

ในตำราเรียนเล่มนี้เราไม่ได้พิจารณารายละเอียดปัญหาทางสถิติ
สมมติฐาน (null - R0 และทางเลือก - Hj) และการตัดสินใจทางสถิติเนื่องจากนักศึกษาจิตวิทยาศึกษาสิ่งนี้แยกกันในสาขาวิชา "วิธีทางคณิตศาสตร์ในด้านจิตวิทยา" นอกจากนี้ควรสังเกตด้วยว่าเมื่อจัดทำรายงานการวิจัย (รายวิชาหรือ วิทยานิพนธ์, สิ่งพิมพ์) ไม่ได้รับสมมติฐานทางสถิติและวิธีแก้ปัญหาทางสถิติตามกฎ โดยปกติเมื่ออธิบายผลลัพธ์จะมีการระบุเกณฑ์ให้ระบุสถิติเชิงพรรณนาที่จำเป็น (หมายถึง, ซิกม่า, สัมประสิทธิ์สหสัมพันธ์ ฯลฯ ), ค่าเชิงประจักษ์ของเกณฑ์, ระดับความเป็นอิสระและจำเป็นต้องมีระดับนัยสำคัญ p . จากนั้นจะมีการกำหนดข้อสรุปที่มีความหมายเกี่ยวกับสมมติฐานที่กำลังทดสอบ โดยระบุ (โดยปกติจะอยู่ในรูปแบบของความไม่เท่าเทียมกัน) ระดับนัยสำคัญที่บรรลุผลสำเร็จหรือไม่บรรลุผล

ความน่าเชื่อถือทางสถิติถือเป็นสิ่งสำคัญในการฝึกคำนวณของ FCC ก่อนหน้านี้มีข้อสังเกตว่าสามารถเลือกตัวอย่างได้หลายตัวอย่างจากประชากรกลุ่มเดียวกัน:

หากเลือกอย่างถูกต้องตัวบ่งชี้เฉลี่ยและตัวบ่งชี้ของประชากรทั่วไปจะแตกต่างกันเล็กน้อยจากขนาดของข้อผิดพลาดในการเป็นตัวแทนโดยคำนึงถึงความน่าเชื่อถือที่ยอมรับได้

หากเลือกจากประชากรที่แตกต่างกัน ความแตกต่างระหว่างพวกเขาจะกลายเป็นเรื่องสำคัญ สถิติเป็นเรื่องเกี่ยวกับการเปรียบเทียบตัวอย่าง

หากพวกเขาแตกต่างกันอย่างไม่มีนัยสำคัญ ไม่มีหลักการ ไม่มีนัยสำคัญ กล่าวคือ จริงๆ แล้วพวกเขาอยู่ในประชากรทั่วไปกลุ่มเดียวกัน ความแตกต่างระหว่างพวกเขาเรียกว่าไม่น่าเชื่อถือทางสถิติ

มีความน่าเชื่อถือทางสถิติ ความแตกต่างของกลุ่มตัวอย่างคือกลุ่มตัวอย่างที่แตกต่างกันอย่างมีนัยสำคัญและเป็นพื้นฐาน กล่าวคือ เป็นของกลุ่มประชากรทั่วไปที่แตกต่างกัน

การประเมินของ FCC นัยสำคัญทางสถิติความแตกต่างของตัวอย่างหมายถึงการแก้ปัญหาเชิงปฏิบัติหลายอย่าง ตัวอย่างเช่น การแนะนำวิธีการสอน โปรแกรม ชุดแบบฝึกหัด แบบทดสอบ แบบฝึกหัดควบคุมใหม่ๆ เชื่อมโยงกับการทดสอบเชิงทดลอง ซึ่งควรแสดงให้เห็นว่ากลุ่มทดสอบมีความแตกต่างโดยพื้นฐานจากกลุ่มควบคุม ดังนั้นจึงใช้วิธีการทางสถิติพิเศษที่เรียกว่าเกณฑ์ที่มีนัยสำคัญทางสถิติ เพื่อตรวจหาการมีหรือไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างตัวอย่าง

เกณฑ์ทั้งหมดแบ่งออกเป็นสองกลุ่ม: แบบอิงพารามิเตอร์และแบบไม่มีพารามิเตอร์ เกณฑ์พาราเมตริกกำหนดให้ต้องมีกฎหมายการแจกแจงแบบปกติ เช่น นี่หมายถึงการกำหนดตัวบ่งชี้หลักของกฎปกติ - ค่าเฉลี่ยเลขคณิตและค่าเบี่ยงเบนมาตรฐาน เกณฑ์พาราเมตริกมีความแม่นยำและถูกต้องที่สุด การทดสอบแบบไม่อิงพารามิเตอร์จะขึ้นอยู่กับความแตกต่างอันดับ (ลำดับ) ระหว่างองค์ประกอบตัวอย่าง

ต่อไปนี้เป็นเกณฑ์หลักสำหรับนัยสำคัญทางสถิติที่ใช้ในการฝึก FCC: การทดสอบของนักเรียนและการทดสอบของฟิชเชอร์

การทดสอบของนักเรียนตั้งชื่อตามนักวิทยาศาสตร์ชาวอังกฤษ K. Gosset (นักเรียน - นามแฝง) ผู้ค้นพบวิธีนี้ การทดสอบของนักเรียนเป็นแบบพาราเมตริกและใช้สำหรับการเปรียบเทียบ ตัวชี้วัดที่แน่นอนตัวอย่าง ตัวอย่างอาจมีขนาดแตกต่างกัน

การทดสอบของนักเรียน ถูกกำหนดเช่นนี้

1. ค้นหาแบบทดสอบ Student โดยใช้สูตรต่อไปนี้:

ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่างที่เปรียบเทียบอยู่ที่ไหน เสื้อ 1, เสื้อ 2 - ข้อผิดพลาดของการเป็นตัวแทนที่ระบุตามตัวบ่งชี้ของกลุ่มตัวอย่างที่เปรียบเทียบ

2. การปฏิบัติที่ FCC แสดงให้เห็นว่าสำหรับงานกีฬาก็เพียงพอที่จะยอมรับความน่าเชื่อถือของบัญชี P = 0.95

ความน่าเชื่อถือในการนับ: P = 0.95 (a = 0.05) พร้อมจำนวนองศาอิสระ

k = n 1 + n 2 - 2 จากตารางในภาคผนวก 4 เราค้นหาค่าของค่าขีด จำกัด ของเกณฑ์ ( ทีกรัม).

3. ขึ้นอยู่กับคุณสมบัติของกฎการกระจายแบบปกติ เกณฑ์ของนักเรียนจะเปรียบเทียบ t และ t gr

เราได้ข้อสรุป:

ถ้า t t gr ความแตกต่างระหว่างตัวอย่างที่เปรียบเทียบนั้นมีนัยสำคัญทางสถิติ

หากไม่ได้หมายความว่าความแตกต่างนั้นไม่มีนัยสำคัญทางสถิติ

สำหรับนักวิจัยในสาขา FCS การประเมินนัยสำคัญทางสถิติเป็นขั้นตอนแรกในการแก้ปัญหาเฉพาะเจาะจง ไม่ว่าตัวอย่างที่เปรียบเทียบจะมีความแตกต่างกันโดยพื้นฐานหรือไม่ก็ตาม ขั้นตอนต่อไปคือการประเมินความแตกต่างนี้จากมุมมองการสอนซึ่งกำหนดโดยเงื่อนไขของงาน

ลองพิจารณาการประยุกต์ใช้แบบทดสอบนักเรียนโดยใช้ตัวอย่างเฉพาะ

ตัวอย่างที่ 2.14 กลุ่มตัวอย่าง 18 คนได้รับการประเมินอัตราการเต้นของหัวใจ (bpm) ก่อน x i และหลัง ใช่แล้วอุ่นเครื่อง

ประเมินประสิทธิผลของการวอร์มอัพตามอัตราการเต้นของหัวใจ ข้อมูลเบื้องต้นและการคำนวณแสดงไว้ในตาราง 2.30 และ 2.31 น.

ตารางที่ 2.30

การประมวลผลตัวบ่งชี้อัตราการเต้นของหัวใจก่อนอบอุ่นร่างกาย

ข้อผิดพลาดสำหรับทั้งสองกลุ่มเกิดขึ้นพร้อมกัน เนื่องจากขนาดตัวอย่างเท่ากัน (กลุ่มเดียวกันได้รับการศึกษาภายใต้เงื่อนไขที่ต่างกัน) และค่าเบี่ยงเบนมาตรฐานคือ s x = s y = 3 ครั้ง/นาที มาดูการกำหนดการทดสอบของนักเรียนกันดีกว่า:

เราตั้งค่าความน่าเชื่อถือของบัญชี: P = 0.95

จำนวนองศาอิสระ k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34 จากตารางในภาคผนวก 4 เราพบ ทีกรัม= 2,02.

การอนุมานทางสถิติ เนื่องจาก t = 11.62 และขอบเขต t gr = 2.02 จากนั้น 11.62 > 2.02 เช่น t > t gr ดังนั้นความแตกต่างระหว่างกลุ่มตัวอย่างจึงมีนัยสำคัญทางสถิติ

ข้อสรุปการสอน พบว่าในแง่ของอัตราการเต้นของหัวใจ ความแตกต่างระหว่างสถานะของกลุ่มก่อนและหลังการอบอุ่นร่างกายมีนัยสำคัญทางสถิติ กล่าวคือ สำคัญและเป็นพื้นฐาน ดังนั้น จากตัวบ่งชี้อัตราการเต้นของหัวใจ เราสามารถสรุปได้ว่าการวอร์มอัพมีประสิทธิผล

เกณฑ์ฟิชเชอร์เป็นพารามิเตอร์ ใช้ในการเปรียบเทียบอัตราการกระจายตัวของตัวอย่าง ซึ่งมักจะหมายถึงการเปรียบเทียบในแง่ของความเสถียรของประสิทธิภาพการกีฬาหรือความเสถียรของตัวบ่งชี้การทำงานและทางเทคนิคในทางปฏิบัติ วัฒนธรรมทางกายภาพและกีฬา ตัวอย่างอาจมีขนาดแตกต่างกัน

เกณฑ์ฟิชเชอร์ถูกกำหนดตามลำดับต่อไปนี้

1. ค้นหาเกณฑ์ฟิชเชอร์ F โดยใช้สูตร

โดยที่ คือความแปรปรวนของกลุ่มตัวอย่างที่เปรียบเทียบ

เงื่อนไขของเกณฑ์ฟิชเชอร์กำหนดไว้ในตัวเศษของสูตร เอฟ มีการกระจายตัวมากเช่น จำนวน F จะมากกว่าหนึ่งเสมอ

เราตั้งค่าความน่าเชื่อถือของการนับ: P = 0.95 - และกำหนดจำนวนองศาอิสระสำหรับทั้งสองตัวอย่าง: k 1 = n 1 - 1, k 2 = n 2 - 1

เมื่อใช้ตารางในภาคผนวก 4 เราจะค้นหาค่าขีดจำกัดของเกณฑ์ F กรัม.

การเปรียบเทียบเกณฑ์ F และ F กรัมช่วยให้เราสามารถสรุปได้:

ถ้า F > F gr ความแตกต่างระหว่างกลุ่มตัวอย่างจะมีนัยสำคัญทางสถิติ

ถ้า F< F гр, то различие между выборками статически недостоверно.

ลองยกตัวอย่างที่เฉพาะเจาะจง

ตัวอย่าง 2.15. มาวิเคราะห์ผู้เล่นแฮนด์บอลสองกลุ่ม: x ฉัน (หมายเลข 1= 16 คน) และ y i (n 2 = 18 คน) นักกีฬากลุ่มเหล่านี้ได้รับการศึกษาเกี่ยวกับเวลาขึ้นเครื่องเมื่อขว้างลูกบอลเข้าประตู

ตัวบ่งชี้แรงผลักเป็นประเภทเดียวกันหรือไม่?

ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.32 และ 2.33

ตารางที่ 2.32

การประมวลผลตัวบ่งชี้การขับไล่ของผู้เล่นแฮนด์บอลกลุ่มแรก

ให้เรากำหนดเกณฑ์ฟิชเชอร์:

ตามข้อมูลที่นำเสนอในตารางภาคผนวก 6 เราพบ Fgr: Fgr = 2.4

ให้เราใส่ใจกับความจริงที่ว่าในตารางในภาคผนวก 6 รายการของจำนวนระดับความอิสระของการกระจายทั้งที่มากขึ้นและเล็กจะหยาบมากขึ้นเมื่อเราเข้าใกล้ตัวเลขที่มากขึ้น ดังนั้นจำนวนองศาความเป็นอิสระของการกระจายตัวที่มากขึ้นตามลำดับนี้: 8, 9, 10, 11, 12, 14, 16, 20, 24 เป็นต้น และอันที่เล็กกว่า - 28, 29, 30, 40 , 50 ฯลฯ ง.

สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าเมื่อขนาดตัวอย่างเพิ่มขึ้น ความแตกต่างในการทดสอบ F จะลดลง และคุณสามารถใช้ค่าแบบตารางที่ใกล้เคียงกับข้อมูลต้นฉบับได้ ดังนั้น ในตัวอย่าง 2.15 =17 หายไป และค่าที่ใกล้เคียงที่สุดสามารถหาได้เป็น k = 16 ซึ่งเราจะได้ Fgr = 2.4

การอนุมานทางสถิติ เนื่องจากการทดสอบของฟิชเชอร์ F= 2.5 > F= 2.4 ตัวอย่างจึงสามารถแยกแยะได้อย่างมีนัยสำคัญทางสถิติ

ข้อสรุปการสอน ค่าของเวลาออกตัวเมื่อโยนบอลเข้าประตูสำหรับผู้เล่นแฮนด์บอลของทั้งสองกลุ่มแตกต่างกันอย่างมีนัยสำคัญ กลุ่มเหล่านี้ควรได้รับการพิจารณาที่แตกต่างกัน

การวิจัยเพิ่มเติมควรเปิดเผยสาเหตุของความแตกต่างนี้

ตัวอย่าง 2.20.(เกี่ยวกับความน่าเชื่อถือทางสถิติของกลุ่มตัวอย่าง - คุณสมบัติของนักฟุตบอลจะดีขึ้นหรือไม่หากเวลาจากการให้สัญญาณในการเตะบอลในช่วงเริ่มต้นการฝึกคือ x i และในตอนท้าย y i

ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.40 และ 2.41

ตารางที่ 2.40

ตัวบ่งชี้เวลาในการประมวลผลจากการให้สัญญาณในการตีลูกบอลเมื่อเริ่มการฝึกซ้อม

ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของนักเรียน:

ด้วยความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 โดยใช้ตารางในภาคผนวก 4 เราพบ ทีกรัม= 2.02. เนื่องจาก t = 8.3 > ทีกรัม= 2.02 - ความแตกต่างมีนัยสำคัญทางสถิติ

ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของฟิชเชอร์:

ตามตารางในภาคผนวก 2 โดยมีความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = 22-1 = 21 ค่า F gr = 21 เนื่องจาก F = 1.53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.

การอนุมานทางสถิติ ตามค่าเฉลี่ยเลขคณิต ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้มีนัยสำคัญทางสถิติ ในแง่ของการกระจายตัว (dispersion) ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้นั้นไม่น่าเชื่อถือทางสถิติ

ข้อสรุปการสอนคุณสมบัติของนักฟุตบอลได้รับการปรับปรุงอย่างมีนัยสำคัญ แต่ควรให้ความสนใจกับความมั่นคงของคำให้การของเขา

การเตรียมงาน

ก่อนหน้านี้ งานห้องปฏิบัติการในสาขาวิชา “มาตรวิทยาการกีฬา” ถึงนักเรียนทุกคน กลุ่มการศึกษามีความจำเป็นต้องจัดตั้งทีมงานจำนวน 3-4 คนในแต่ละกลุ่มเพื่อร่วมกันมอบหมายงานงานห้องปฏิบัติการทั้งหมดให้เสร็จสิ้น

ในการเตรียมงาน อ่านส่วนที่เกี่ยวข้องของวรรณกรรมที่แนะนำ (ดูหัวข้อที่ 6 ของข้อมูล คำแนะนำระเบียบวิธี) และบันทึกการบรรยาย ศึกษาส่วนที่ 1 และ 2 สำหรับงานในห้องปฏิบัติการนี้ ตลอดจนการมอบหมายงาน (ส่วนที่ 4)

เตรียมแบบฟอร์มรายงานบนกระดาษเขียนขนาด A4 มาตรฐาน และเติมวัสดุที่จำเป็นสำหรับการทำงาน

โดยในรายงานจะต้องมี :

หน้าแรกโดยระบุแผนก (UC และ TR) กลุ่มวิชา นามสกุล ชื่อจริง นามสกุลของนักศึกษา หมายเลขและชื่อผลงานห้องปฏิบัติการ วันที่สำเร็จการศึกษา ตลอดจนนามสกุล ปริญญาทางวิชาการ ตำแหน่งทางวิชาการ และตำแหน่ง ครูรับงาน;

วัตถุประสงค์ของงาน

สูตรที่มีค่าตัวเลขอธิบายผลการคำนวณขั้นกลางและขั้นสุดท้าย

ตารางค่าที่วัดและคำนวณได้

วัสดุกราฟิกที่จำเป็นสำหรับงาน;

ข้อสรุปโดยย่อขึ้นอยู่กับผลลัพธ์ของแต่ละขั้นตอนของการมอบหมายงานและโดยทั่วไปของงานที่ทำ

กราฟและตารางทั้งหมดถูกวาดอย่างระมัดระวังโดยใช้เครื่องมือวาดภาพ สัญลักษณ์กราฟิกและตัวอักษรทั่วไปต้องเป็นไปตาม GOST อนุญาตให้จัดทำรายงานโดยใช้เทคโนโลยีคอมพิวเตอร์ได้

การมอบหมายงาน

ก่อนที่จะดำเนินการวัดทั้งหมด สมาชิกในทีมแต่ละคนจะต้องศึกษากฎการใช้งาน เกมกีฬาลูกดอกที่ให้ไว้ในภาคผนวก 7 ซึ่งจำเป็นสำหรับการดำเนินการวิจัยในขั้นตอนต่อไปนี้

ระยะที่ 1 ของการวิจัย“การศึกษาผลการตีเป้าหมายของเกมกีฬาปาเป้าโดยสมาชิกแต่ละคนในทีมเพื่อให้เป็นไปตามกฎหมายการกระจายสินค้าตามปกติตามหลักเกณฑ์ χ 2เพียร์สันและเกณฑ์สามซิกมา"

1. วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำ ด้วยการขว้างปาเป้า 30-40 ครั้งไปที่เป้าหมายวงกลมในเกมกีฬาปาเป้า

2. ผลการวัด (การทดสอบ) x ฉัน(ในแก้ว) จัดรูปแบบในรูปแบบของชุดรูปแบบและป้อนลงในตาราง 4.1 (คอลัมน์ ทำการคำนวณที่จำเป็นทั้งหมด กรอกตารางที่จำเป็นและสรุปผลที่เหมาะสมเกี่ยวกับการปฏิบัติตามผลการแจกแจงเชิงประจักษ์ที่เกิดขึ้นกับกฎหมายการกระจายแบบปกติโดย การเปรียบเทียบกับการคำนวณ ตาราง และข้อสรุปที่คล้ายกันของตัวอย่าง 2.12 ที่ให้ไว้ในส่วนที่ 2 ของแนวทางเหล่านี้ในหน้า 7 - 10

ตารางที่ 4.1

ความสอดคล้องของความเร็วและการประสานงานของการกระทำของอาสาสมัครกับกฎหมายการกระจายแบบปกติ

เลขที่										โค้งมน







…
…
ทั้งหมด

II – ขั้นตอนการวิจัย

“การประเมินตัวบ่งชี้เฉลี่ยของประชากรทั่วไปในการโจมตีเป้าหมายของเกมกีฬาปาเป้าของนักเรียนทุกคนในกลุ่มเรียนโดยพิจารณาจากผลการวัดของสมาชิกของทีมเดียว”

ประเมินตัวบ่งชี้ความเร็วเฉลี่ยและการประสานงานของการกระทำของนักเรียนทุกคนในกลุ่มการศึกษา (ตามรายชื่อกลุ่มการศึกษาในนิตยสารชั้นเรียน) ตามผลการตีเป้าหมายปาเป้าของสมาชิกในทีมทั้งหมดที่ได้รับในระยะแรก ของงานวิจัยในห้องปฏิบัติการนี้

1. บันทึกผลการวัดความเร็วและการประสานงานของการกระทำ เมื่อขว้างปาเป้าไปที่เป้าหมายวงกลมในเกมกีฬา ปาเป้าของสมาชิกทุกคนในทีมของคุณ (2 - 4 คน) ซึ่งเป็นตัวอย่างผลการวัดจากประชากรทั่วไป (ผลการวัดของนักเรียนทุกคนในกลุ่มเรียน - เช่น จำนวน 15 คน) โดยระบุในคอลัมน์ที่สองและสาม ตารางที่ 4.2

ตารางที่ 4.2

ตัวชี้วัดการประมวลผลความเร็วและการประสานงานของการกระทำ

สมาชิกกองพลน้อย

เลขที่


…
…
ทั้งหมด

ในตาราง 4.2 ภายใต้ ควรจะเข้าใจ , คะแนนเฉลี่ยที่ตรงกัน (ดูผลการคำนวณในตารางที่ 4.1) สมาชิกในทีมของคุณ ( , ได้รับในขั้นตอนแรกของการวิจัย ควรสังเกตว่า ตามกฎแล้ว ตาราง 4.2 ประกอบด้วยค่าเฉลี่ยที่คำนวณได้ของผลการวัดที่ได้รับโดยสมาชิกคนหนึ่งในทีมในขั้นตอนแรกของการวิจัย เนื่องจากโอกาสที่ผลการวัดของสมาชิกในทีมแต่ละคนจะตรงกันนั้นมีน้อยมาก แล้ว, ตามกฎแล้วค่าต่างๆ ในคอลัมน์ ตารางที่ 4.2 สำหรับแต่ละแถว - เท่ากับ 1 ก ในบรรทัด “ยอดรวม " คอลัมน์ " " ถูกเขียน จำนวนสมาชิกในทีมของคุณ

2. ทำการคำนวณที่จำเป็นทั้งหมดเพื่อกรอกตาราง 4.2 รวมถึงการคำนวณและข้อสรุปอื่น ๆ ที่คล้ายกับการคำนวณและข้อสรุปของตัวอย่าง 2.13 ที่ให้ไว้ในส่วนที่ 2 ของสิ่งนี้ การพัฒนาระเบียบวิธีในหน้า 13-14. ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" มีความจำเป็นต้องใช้สูตร 2.4 ที่ให้ไว้ในหน้า 13 ของการพัฒนาวิธีการนี้เนื่องจากกลุ่มตัวอย่างมีขนาดเล็ก (n และจำนวนองค์ประกอบของประชากรทั่วไป N เป็นที่รู้จักและเท่ากับจำนวนนักเรียนในกลุ่มการศึกษา ตามรายชื่อวารสารของกลุ่มศึกษา

III – ขั้นตอนการวิจัย

การประเมินประสิทธิผลของการวอร์มอัพตามตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” โดยสมาชิกในทีมแต่ละคนโดยใช้แบบทดสอบของนักเรียน

เพื่อประเมินประสิทธิผลของการวอร์มอัพสำหรับการขว้างลูกดอกไปยังเป้าหมายของเกมกีฬา "ปาเป้า" ซึ่งดำเนินการในขั้นตอนแรกของการวิจัยของงานในห้องปฏิบัติการนี้โดยสมาชิกแต่ละคนในทีมตามตัวบ่งชี้ "ความเร็วและ การประสานงานของการกระทำ" โดยใช้เกณฑ์ของนักเรียน - เกณฑ์พาราเมตริกสำหรับความน่าเชื่อถือทางสถิติของกฎการกระจายเชิงประจักษ์กับกฎการกระจายแบบปกติ

… ทั้งหมด

2. ความแตกต่าง และอาร์เอ็มเอส , ผลการวัดตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” ตามผลการวอร์มอัพ, กำหนดไว้ในตาราง 4.3 (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.30 ของตัวอย่าง 2.14 ในหน้า 16 ของการพัฒนาวิธีการนี้)

3. ทีมงานแต่ละคน วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำหลังจากการวอร์มอัพ

… ทั้งหมด

5. ทำการคำนวณโดยเฉลี่ย ความแตกต่าง และอาร์เอ็มเอส ,ผลการวัดตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" หลังจากการอุ่นเครื่อง กำหนดไว้ในตาราง 4.4 เขียนผลการวัดโดยรวมตามผลการอุ่นเครื่อง (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.31 ของตัวอย่าง 2.14 ในหน้า 17 ของการพัฒนาวิธีการนี้)

6. ทำการคำนวณและข้อสรุปที่จำเป็นทั้งหมดคล้ายกับการคำนวณและข้อสรุปของตัวอย่างที่ 2.14 ที่ให้ไว้ในส่วนที่ 2 ของการพัฒนาวิธีการนี้ในหน้า 16-17 ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" จำเป็นต้องใช้สูตร 2.1 ที่ให้ไว้ในหน้า 12 ของการพัฒนาวิธีการนี้เนื่องจากตัวอย่างคือ n และจำนวนองค์ประกอบในประชากร N ( ไม่ทราบ

IV – ขั้นตอนการวิจัย

การประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์

ประเมินความสม่ำเสมอ (ความเสถียร) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์ตามผลการวัดที่ได้รับในขั้นตอนที่สามของการวิจัยในงานห้องปฏิบัติการนี้

ในการทำเช่นนี้คุณต้องทำสิ่งต่อไปนี้

การใช้ข้อมูลจากตาราง 4.3 และ 4.4 ผลลัพธ์ของการคำนวณความแปรปรวนจากตารางเหล่านี้ที่ได้รับในขั้นตอนที่สามของการวิจัยตลอดจนวิธีการคำนวณและการใช้เกณฑ์ฟิชเชอร์เพื่อประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้กีฬาที่ให้ไว้ใน ตัวอย่าง 2.15 ในหน้า 18-19 ของการพัฒนาวิธีการนี้ ให้สรุปผลทางสถิติและการสอนที่เหมาะสม

V – ขั้นตอนการวิจัย

การประเมินกลุ่มตัวบ่งชี้ “ความรวดเร็วและการประสานงานของการกระทำ” ของสมาชิกในทีมหนึ่งคนก่อนและหลังการวอร์มอัพ

คุณสมบัติที่ต้องชำระเงินคุณลักษณะนัยสำคัญทางสถิติมีเฉพาะบางส่วนเท่านั้น แผนภาษี- ตรวจสอบว่าอยู่ใน.

คุณสามารถดูได้ว่าคำตอบที่ได้รับมีความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่ กลุ่มที่แตกต่างกันผู้ตอบแบบสอบถาม หากต้องการใช้คุณลักษณะนัยสำคัญทางสถิติใน SurveyMonkey คุณต้อง:

เปิดใช้งานคุณลักษณะนัยสำคัญทางสถิติเมื่อเพิ่มกฎการเปรียบเทียบให้กับคำถามในแบบสำรวจของคุณ เลือกกลุ่มผู้ตอบแบบสอบถามเพื่อเปรียบเทียบเพื่อจัดเรียงผลการสำรวจเป็นกลุ่มเพื่อเปรียบเทียบด้วยภาพ
ตรวจสอบตารางที่มีข้อมูลเกี่ยวกับคำถามในแบบสำรวจของคุณเพื่อระบุการมีอยู่ของข้อมูลทางสถิติ ความแตกต่างที่สำคัญในคำตอบที่ได้รับจากผู้ตอบแบบสอบถามกลุ่มต่างๆ

ดูนัยสำคัญทางสถิติ

โดยทำตามขั้นตอนด้านล่าง คุณจะสามารถสร้างแบบสำรวจที่แสดงนัยสำคัญทางสถิติได้

1. เพิ่มคำถามปลายปิดในแบบสำรวจของคุณ

เพื่อแสดงนัยสำคัญทางสถิติเมื่อวิเคราะห์ผลลัพธ์ คุณจะต้องใช้กฎการเปรียบเทียบกับคำถามใดๆ ในแบบสำรวจของคุณ

คุณสามารถใช้กฎการเปรียบเทียบและคำนวณนัยสำคัญทางสถิติในการตอบสนอง หากคุณใช้ข้อใดข้อหนึ่งต่อไปนี้ในการออกแบบแบบสำรวจของคุณ: ประเภทต่อไปนี้คำถาม:

จำเป็นต้องตรวจสอบให้แน่ใจว่าตัวเลือกคำตอบที่เสนอสามารถแบ่งออกเป็นกลุ่มได้ครบถ้วน ตัวเลือกการตอบสนองที่คุณเลือกสำหรับการเปรียบเทียบเมื่อคุณสร้างกฎการเปรียบเทียบจะถูกใช้เพื่อจัดระเบียบข้อมูลลงในครอสแท็บตลอดทั้งแบบสำรวจ

2. รวบรวมคำตอบ

เมื่อคุณทำแบบสำรวจเสร็จแล้ว ให้สร้างผู้รวบรวมเพื่อส่งออก มีหลายวิธี

คุณต้องได้รับการตอบกลับอย่างน้อย 30 รายการสำหรับแต่ละตัวเลือกการตอบกลับที่คุณวางแผนจะใช้ในกฎการเปรียบเทียบเพื่อเปิดใช้งานและดูนัยสำคัญทางสถิติ

ตัวอย่างการสำรวจ

คุณต้องการค้นหาว่าผู้ชายพอใจกับผลิตภัณฑ์ของคุณมากกว่าผู้หญิงอย่างมีนัยสำคัญหรือไม่

เพิ่มคำถามแบบเลือกตอบสองข้อในแบบสำรวจของคุณ:
เพศของคุณคืออะไร? (ชาย, หญิง)
คุณพอใจหรือไม่พอใจกับผลิตภัณฑ์ของเรา? (พอใจ, ไม่พอใจ)
ตรวจสอบให้แน่ใจว่าผู้ตอบแบบสอบถามอย่างน้อย 30 คนเลือก "ชาย" สำหรับคำถามเรื่องเพศ และผู้ตอบแบบสอบถามอย่างน้อย 30 คนเลือก "หญิง" เป็นเพศ
เพิ่มกฎการเปรียบเทียบให้กับคำถาม "คุณเพศอะไร" และเลือกทั้งสองตัวเลือกเป็นกลุ่มของคุณ
ใช้ตารางข้อมูลด้านล่างแผนภูมิคำถาม "คุณพอใจหรือไม่พอใจกับผลิตภัณฑ์ของเรา" เพื่อดูว่าตัวเลือกการตอบสนองใดๆ แสดงความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่

ความแตกต่างที่มีนัยสำคัญทางสถิติคืออะไร?

ความแตกต่างที่มีนัยสำคัญทางสถิติหมายความว่าการวิเคราะห์ทางสถิติได้กำหนดว่ามีความแตกต่างที่มีนัยสำคัญระหว่างคำตอบของผู้ตอบแบบสอบถามกลุ่มหนึ่งและคำตอบของอีกกลุ่มหนึ่ง นัยสำคัญทางสถิติหมายความว่าตัวเลขที่ได้รับแตกต่างกันอย่างมีนัยสำคัญ ความรู้ดังกล่าวจะช่วยคุณในการวิเคราะห์ข้อมูลได้อย่างมาก อย่างไรก็ตาม คุณเป็นผู้กำหนดความสำคัญของผลลัพธ์ที่ได้รับ คุณเป็นผู้ตัดสินใจว่าจะตีความผลการสำรวจอย่างไร และควรดำเนินการอย่างไรโดยพิจารณาจากผลลัพธ์เหล่านั้น

ตัวอย่างเช่น คุณได้รับการร้องเรียนจากลูกค้าผู้หญิงมากกว่าลูกค้าผู้ชาย เราจะทราบได้อย่างไรว่าความแตกต่างดังกล่าวมีจริงหรือไม่ และจำเป็นต้องดำเนินการอย่างไร วิธีหนึ่งที่ดีในการทดสอบข้อสังเกตของคุณคือทำแบบสำรวจที่จะแสดงให้คุณเห็นว่าลูกค้าผู้ชายพอใจกับผลิตภัณฑ์ของคุณมากกว่าอย่างเห็นได้ชัดหรือไม่ เมื่อใช้สูตรทางสถิติ ฟังก์ชันนัยสำคัญทางสถิติของเราจะทำให้คุณสามารถระบุได้ว่าจริงๆ แล้วผลิตภัณฑ์ของคุณดึงดูดใจผู้ชายมากกว่าผู้หญิงหรือไม่ ซึ่งจะทำให้คุณสามารถดำเนินการตามข้อเท็จจริงมากกว่าการคาดเดา

ความแตกต่างที่มีนัยสำคัญทางสถิติ

หากผลลัพธ์ของคุณถูกเน้นไว้ในตารางข้อมูล แสดงว่าผู้ตอบแบบสอบถามทั้งสองกลุ่มมีความแตกต่างกันอย่างมาก คำว่า “นัยสำคัญ” ไม่ได้หมายความว่าตัวเลขผลลัพธ์มีความสำคัญหรือนัยสำคัญใดๆ เฉพาะเจาะจง เพียงแต่ว่ามีความแตกต่างทางสถิติระหว่างตัวเลขเหล่านั้นเท่านั้น

ไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติ

หากผลลัพธ์ของคุณไม่ได้ถูกเน้นในตารางข้อมูลที่เกี่ยวข้อง นั่นหมายความว่าแม้ว่าตัวเลขทั้งสองที่นำมาเปรียบเทียบอาจมีความแตกต่างกัน แต่ก็ไม่มีความแตกต่างทางสถิติระหว่างตัวเลขเหล่านั้น

การตอบสนองที่ไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติแสดงให้เห็นว่าไม่มีความแตกต่างที่มีนัยสำคัญระหว่างสองรายการที่ถูกเปรียบเทียบเมื่อพิจารณาจากขนาดตัวอย่างที่คุณใช้ แต่ไม่ได้หมายความว่ารายการเหล่านั้นไม่มีนัยสำคัญเสมอไป บางทีด้วยการเพิ่มขนาดตัวอย่าง คุณจะสามารถระบุความแตกต่างที่มีนัยสำคัญทางสถิติได้

ขนาดตัวอย่าง

หากคุณมีขนาดตัวอย่างน้อยมากเท่านั้น ความแตกต่างที่ยิ่งใหญ่ระหว่างสองกลุ่ม หากคุณมีขนาดตัวอย่างที่ใหญ่มาก ความแตกต่างทั้งเล็กและใหญ่จะถูกนับว่ามีนัยสำคัญ

อย่างไรก็ตาม การที่ตัวเลขสองตัวมีความแตกต่างกันทางสถิติไม่ได้หมายความว่าความแตกต่างระหว่างผลลัพธ์จะสร้างความแตกต่างให้กับคุณแต่อย่างใด ความสำคัญในทางปฏิบัติ- คุณจะต้องตัดสินใจด้วยตัวเองว่าความแตกต่างใดที่มีความหมายต่อแบบสำรวจของคุณ

การคำนวณนัยสำคัญทางสถิติ

เราคำนวณนัยสำคัญทางสถิติโดยใช้ระดับความเชื่อมั่น 95% มาตรฐาน ถ้าตัวเลือกคำตอบแสดงเป็นนัยสำคัญทางสถิติ หมายความว่าโดยบังเอิญเพียงอย่างเดียวหรือเนื่องจากข้อผิดพลาดในการสุ่มตัวอย่าง มีความน่าจะเป็นน้อยกว่า 5% ของความแตกต่างระหว่างสองกลุ่มที่เกิดขึ้น (มักแสดงเป็น: p<0,05).

ในการคำนวณความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างกลุ่ม เราใช้สูตรต่อไปนี้:

พารามิเตอร์	คำอธิบาย
ก1	เปอร์เซ็นต์ของผู้เข้าร่วมจากกลุ่มแรกที่ตอบคำถามด้วยวิธีใดวิธีหนึ่ง คูณด้วยขนาดกลุ่มตัวอย่างของกลุ่มนี้
ข1	เปอร์เซ็นต์ของผู้เข้าร่วมจากกลุ่มที่สองที่ตอบคำถามด้วยวิธีใดวิธีหนึ่ง คูณด้วยขนาดกลุ่มตัวอย่างของกลุ่มนี้
สัดส่วนตัวอย่างรวม (p)	การรวมกันของสองหุ้นจากทั้งสองกลุ่ม
ข้อผิดพลาดมาตรฐาน (SE)	ตัวบ่งชี้ว่าหุ้นของคุณแตกต่างจากหุ้นจริงมากน้อยเพียงใด ค่าที่ต่ำกว่าหมายถึงเศษส่วนนั้นใกล้เคียงกับเศษส่วนจริง ค่าที่สูงกว่าหมายความว่าเศษส่วนนั้นแตกต่างจากเศษส่วนจริงอย่างมาก
สถิติการทดสอบ (t)	สถิติการทดสอบ จำนวนค่าเบี่ยงเบนมาตรฐานซึ่งค่าที่กำหนดแตกต่างจากค่าเฉลี่ย
นัยสำคัญทางสถิติ	หากค่าสัมบูรณ์ของสถิติการทดสอบมากกว่า 1.96* ส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย จะถือว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติ

*1.96 คือค่าที่ใช้สำหรับระดับความเชื่อมั่น 95% เนื่องจาก 95% ของช่วงที่ฟังก์ชันการแจกแจงแบบ t ของนักเรียนจัดการอยู่ภายในค่าเบี่ยงเบนมาตรฐาน 1.96 ของค่าเฉลี่ย

ตัวอย่างการคำนวณ

จากตัวอย่างที่ใช้ข้างต้น มาดูกันว่าเปอร์เซ็นต์ของผู้ชายที่กล่าวว่าตนพอใจกับผลิตภัณฑ์ของคุณนั้นสูงกว่าเปอร์เซ็นต์ของผู้หญิงอย่างมีนัยสำคัญหรือไม่

สมมติว่าผู้ชาย 1,000 คนและผู้หญิง 1,000 คนมีส่วนร่วมในการสำรวจของคุณ และผลการสำรวจพบว่าผู้ชาย 70% และผู้หญิง 65% กล่าวว่าพวกเขาพอใจกับผลิตภัณฑ์ของคุณ ระดับ 70% สูงกว่าระดับ 65% อย่างมีนัยสำคัญหรือไม่

แทนที่ข้อมูลต่อไปนี้จากแบบสำรวจลงในสูตรที่กำหนด:

p1 (% ของผู้ชายพอใจกับผลิตภัณฑ์) = 0.7
p2 (% ของผู้หญิงที่พอใจกับผลิตภัณฑ์) = 0.65
n1 (จำนวนผู้ชายที่สำรวจ) = 1,000
n2 (จำนวนผู้หญิงที่สัมภาษณ์) = 1,000

เนื่องจากค่าสัมบูรณ์ของสถิติการทดสอบมากกว่า 1.96 หมายความว่าความแตกต่างระหว่างชายและหญิงมีนัยสำคัญ เมื่อเทียบกับผู้หญิง ผู้ชายมีแนวโน้มที่จะพอใจกับผลิตภัณฑ์ของคุณมากกว่า

ซ่อนนัยสำคัญทางสถิติ

วิธีซ่อนนัยสำคัญทางสถิติสำหรับทุกคำถาม

คลิกลูกศรลงทางด้านขวาของกฎการเปรียบเทียบในแถบด้านข้างซ้าย
เลือกรายการ แก้ไขกฎ.
ปิดการใช้งานคุณสมบัติ แสดงนัยสำคัญทางสถิติโดยใช้สวิตช์
คลิกปุ่ม นำมาใช้.

หากต้องการซ่อนนัยสำคัญทางสถิติสำหรับคำถามเดียว คุณต้อง:

คลิกปุ่ม ปรับแต่งเหนือแผนภาพของปัญหานี้
เปิดแท็บ ตัวเลือกการแสดงผล.
ยกเลิกการเลือกช่องถัดจาก นัยสำคัญทางสถิติ.
คลิกปุ่ม บันทึก.

ตัวเลือกการแสดงผลจะเปิดใช้งานโดยอัตโนมัติเมื่อเปิดใช้งานการแสดงนัยสำคัญทางสถิติ หากคุณล้างตัวเลือกการแสดงผลนี้ การแสดงนัยสำคัญทางสถิติจะถูกปิดใช้งานด้วย

เปิดคุณลักษณะนัยสำคัญทางสถิติเมื่อเพิ่มกฎการเปรียบเทียบให้กับคำถามในแบบสำรวจของคุณ ตรวจสอบตารางข้อมูลสำหรับคำถามในแบบสำรวจของคุณเพื่อดูว่าคำตอบที่ได้รับจากกลุ่มผู้ตอบแบบสอบถามแต่ละกลุ่มมีความแตกต่างกันอย่างมีนัยสำคัญทางสถิติหรือไม่