การประเมินความน่าเชื่อถือของผลการวิจัยทางสถิติ ระดับความเชื่อมั่นทางสถิติ
นัยสำคัญทางสถิติ
ผลลัพธ์ที่ได้โดยใช้ขั้นตอนการวิจัยเฉพาะเรียกว่า มีนัยสำคัญทางสถิติหากความน่าจะเป็นของการเกิดขึ้นแบบสุ่มมีน้อยมาก แนวคิดนี้สามารถอธิบายได้ด้วยตัวอย่างการโยนเหรียญ สมมติว่าโยนเหรียญ 30 ครั้ง; หัวขึ้นมา 17 ครั้ง และก้อยขึ้นมา 13 ครั้ง เป็น สำคัญการเบี่ยงเบนของผลลัพธ์นี้ไปจากที่คาดไว้ (15 หัวและ 15 ก้อย) หรือการเบี่ยงเบนนี้เป็นแบบสุ่ม? เพื่อตอบคำถามนี้ คุณสามารถโยนเหรียญเดียวกันหลาย ๆ ครั้ง 30 ครั้งติดต่อกัน และในเวลาเดียวกันให้สังเกตว่าอัตราส่วนของ "หัว" ต่อ "ก้อย" ของ 17:13 ซ้ำกี่ครั้ง การวิเคราะห์ทางสถิติช่วยเราจากกระบวนการที่น่าเบื่อนี้ ด้วยความช่วยเหลือนี้ หลังจากการโยนเหรียญ 30 ครั้งแรก คุณสามารถประมาณจำนวนสุ่มที่เป็นไปได้ของ "หัว" 17 อันและ "ก้อย" 13 อัน การประเมินดังกล่าวเรียกว่าข้อความความน่าจะเป็น
ใน วรรณกรรมทางวิทยาศาสตร์ในทางจิตวิทยาอุตสาหกรรม-องค์กร ข้อความความน่าจะเป็นในรูปแบบทางคณิตศาสตร์จะแสดงด้วยนิพจน์ ร(ความน่าจะเป็น)< (менее) 0,05 (5 %), которое следует читать как «вероятность менее 5 %». В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 «орлов» и 13 «решек» менее, чем в 5 опытах. Этот результат будет сочтен статистически значимым, поскольку в индустриально-организационной психологии уже давно приняты стандарты статистической значимости 0,05 и 0,01 (หน้า< 0.01) ข้อเท็จจริงนี้มีความสำคัญต่อการทำความเข้าใจวรรณกรรม แต่ไม่ควรหมายความว่าการสังเกตที่ไม่เป็นไปตามมาตรฐานเหล่านี้ไม่มีประโยชน์ ที่เรียกว่าผลการวิจัยที่ไม่มีนัยสำคัญ (ข้อสังเกตที่ได้มาโดยบังเอิญ) มากกว่า 1-5 ครั้งจากทั้งหมด 100 ครั้ง) จะมีประโยชน์มากในการระบุแนวโน้มและเป็นแนวทางในการวิจัยในอนาคต
ควรสังเกตด้วยว่านักจิตวิทยาบางคนไม่เห็นด้วยกับมาตรฐานและขั้นตอนปฏิบัติแบบดั้งเดิม (เช่น Cohen, 1994; Sauley & Bedeian, 1989) ปัญหาการวัดก็อยู่ที่ตัวเอง ธีมหลักงานของนักวิจัยหลายคนศึกษาความแม่นยำของวิธีการวัดและสถานที่ที่รองรับ วิธีการที่มีอยู่และมาตรฐานตลอดจนการพัฒนาแพทย์และเครื่องมือใหม่ๆ บางทีในอนาคต การวิจัยในด้านอำนาจนี้อาจนำไปสู่การเปลี่ยนแปลงมาตรฐานดั้งเดิมในการประเมินนัยสำคัญทางสถิติ และการเปลี่ยนแปลงเหล่านี้จะได้รับการยอมรับอย่างกว้างขวาง (ส่วนที่ห้าของสมาคมจิตวิทยาอเมริกันคือกลุ่มนักจิตวิทยาที่เชี่ยวชาญด้านการศึกษาการประเมิน การวัด และสถิติ)
ในรายงานการวิจัย ข้อความความน่าจะเป็น เช่น ร< 0.05 เนื่องจากบางส่วน สถิติ,นั่นคือตัวเลขที่ได้รับจากขั้นตอนการคำนวณทางคณิตศาสตร์ชุดหนึ่ง การยืนยันความน่าจะเป็นนั้นได้มาโดยการเปรียบเทียบสถิติเหล่านี้กับข้อมูลจากตารางพิเศษที่เผยแพร่เพื่อจุดประสงค์นี้ ในการวิจัยทางจิตวิทยาอุตสาหกรรม-องค์กร สถิติต่างๆ เช่น r, F, t, r>(อ่านว่า “ไคสแควร์”) และ ร(อ่านว่า "พหูพจน์" ร").ในแต่ละกรณี สถิติ (ตัวเลขหนึ่งตัว) ที่ได้จากการวิเคราะห์ชุดข้อสังเกตสามารถนำมาเปรียบเทียบกับตัวเลขจากตารางที่เผยแพร่ได้ หลังจากนี้ คุณสามารถกำหนดข้อความความน่าจะเป็นเกี่ยวกับความน่าจะเป็นที่จะได้ตัวเลขนี้แบบสุ่ม นั่นคือสรุปเกี่ยวกับความสำคัญของการสังเกต
เพื่อให้เข้าใจการศึกษาที่อธิบายไว้ในหนังสือเล่มนี้ ก็เพียงพอแล้วที่จะมีความเข้าใจที่ชัดเจนเกี่ยวกับแนวคิดเรื่องนัยสำคัญทางสถิติ และไม่จำเป็นต้องรู้ว่าสถิติที่กล่าวมาข้างต้นคำนวณอย่างไร อย่างไรก็ตาม มันจะเป็นประโยชน์ที่จะหารือเกี่ยวกับสมมติฐานข้อหนึ่งที่อยู่ภายใต้ขั้นตอนเหล่านี้ทั้งหมด นี่คือสมมติฐานที่ว่าตัวแปรที่สังเกตได้ทั้งหมดมีการกระจายแบบปกติโดยประมาณ นอกจากนี้ เมื่ออ่านรายงานการวิจัยทางจิตวิทยาขององค์กรอุตสาหกรรม แนวคิดอื่นอีกสามประการมักจะเจอกับบทละครนั้น บทบาทที่สำคัญ- ประการแรก สหสัมพันธ์ และ การเชื่อมต่อความสัมพันธ์ประการที่สอง ตัวแปรดีเทอร์มิแนนต์/ตัวทำนายและ ANOVA ( การวิเคราะห์ความแปรปรวน) ประการที่สาม กลุ่มวิธีการทางสถิติภายใต้ ชื่อสามัญ"การวิเคราะห์เมตา"
ลองพิจารณาตัวอย่างทั่วไปของการใช้วิธีการทางสถิติในการแพทย์ ผู้สร้างยาแนะนำให้เพิ่มการขับปัสสาวะตามสัดส่วนของขนาดยาที่ได้รับ เพื่อทดสอบสมมติฐานนี้ พวกเขาให้อาสาสมัคร 5 คนในขนาดยาที่แตกต่างกัน
จากผลการสังเกต กราฟของการขับปัสสาวะเทียบกับขนาดยาจะถูกพล็อต (รูปที่ 1.2A) การพึ่งพาอาศัยกันสามารถมองเห็นได้ด้วยตาเปล่า นักวิจัยแสดงความยินดีกับการค้นพบนี้และโลกของยาขับปัสสาวะชนิดใหม่
ในความเป็นจริง ข้อมูลช่วยให้เราระบุได้อย่างน่าเชื่อถือว่าอาสาสมัครทั้งห้าคนนี้มีการขับปัสสาวะตามขนาดยา ความจริงที่ว่าการพึ่งพาอาศัยกันนี้จะปรากฏในทุกคนที่เสพยานั้นไม่มีอะไรมากไปกว่าข้อสันนิษฐาน
จี
กับ
ชีวิต ไม่สามารถพูดได้ว่ามันไม่มีโคมลอย - ไม่เช่นนั้นทำไมต้องทำการทดลอง?
แต่ยาก็ขายไป ทั้งหมด ผู้คนมากขึ้นรับไปโดยหวังว่าจะเพิ่มการปัสสาวะออก แล้วเราเห็นอะไร? เราเห็นรูปที่ 1.2B ซึ่งบ่งชี้ว่าไม่มีความเชื่อมโยงระหว่างขนาดยากับการขับปัสสาวะ วงกลมสีดำบ่งบอกถึงข้อมูลจากการศึกษาต้นฉบับ สถิติมีวิธีการที่ช่วยให้เราประเมินความเป็นไปได้ที่จะได้รับตัวอย่างที่ "ไม่ได้เป็นตัวแทน" และทำให้เกิดความสับสนอย่างแท้จริง ปรากฎว่าหากไม่มีความสัมพันธ์ระหว่างการขับปัสสาวะกับขนาดยา จะสังเกต "การพึ่งพา" ที่เกิดขึ้นในการทดลองประมาณ 5 จาก 1,000 ครั้ง ดังนั้น ในกรณีนี้ นักวิจัยโชคไม่ดีเลย แม้ว่าพวกเขาจะใช้วิธีการทางสถิติขั้นสูงสุด แต่ก็ยังไม่สามารถป้องกันพวกเขาจากการทำผิดพลาดได้
เราให้ตัวอย่างที่สมมติขึ้นนี้ แต่ไม่ไกลจากความเป็นจริงเลย โดยไม่ชี้ให้เห็นถึงความไร้ประโยชน์
ความเป็นมาของสถิติ เขาพูดถึงเรื่องอื่นเกี่ยวกับลักษณะความน่าจะเป็นของข้อสรุปของเธอ จากการใช้วิธีการทางสถิติ เราไม่ได้รับความจริงขั้นสุดท้าย แต่เป็นเพียงการประมาณความน่าจะเป็นของสมมติฐานเฉพาะเท่านั้น นอกจากนี้ วิธีการทางสถิติแต่ละวิธียังขึ้นอยู่กับวิธีการทางสถิติของตัวเองอีกด้วย แบบจำลองทางคณิตศาสตร์และผลลัพธ์ก็ถูกต้องจนโมเดลนี้สอดคล้องกับความเป็นจริง
เพิ่มเติมในหัวข้อความน่าเชื่อถือและความสำคัญทางสถิติ:
- ความแตกต่างที่มีนัยสำคัญทางสถิติในตัวชี้วัดคุณภาพชีวิต
- ประชากรทางสถิติ ลักษณะทางบัญชี แนวคิดการวิจัยต่อเนื่องและคัดเลือก ข้อกำหนดสำหรับข้อมูลทางสถิติและการใช้เอกสารทางบัญชีและการรายงาน
- เชิงนามธรรม. การศึกษาความน่าเชื่อถือของตัวชี้วัด TONOMETER สำหรับการวัดความดันภายในลูกตาผ่านเปลือกตา 2561, 2561
ในสถานการณ์ทางวิทยาศาสตร์และการปฏิบัติของการทดลอง (แบบสำรวจ) นักวิจัยสามารถศึกษาได้ไม่ใช่ทุกคน (ประชากรทั่วไป ประชากร) แต่จะศึกษาเพียงตัวอย่างบางส่วนเท่านั้น ตัวอย่างเช่น แม้ว่าเราจะศึกษาคนกลุ่มเล็กๆ เช่น ผู้ที่เป็นโรคเฉพาะเจาะจง แต่ก็ยังไม่น่าเป็นไปได้ที่เราจะมีทรัพยากรที่เหมาะสมหรือไม่จำเป็นต้องทดสอบผู้ป่วยทุกราย แต่เป็นเรื่องปกติที่จะทดสอบตัวอย่างจากประชากรแทน เนื่องจากสะดวกกว่าและใช้เวลาน้อยกว่า ถ้าเป็นเช่นนั้นเราจะรู้ได้อย่างไรว่าผลลัพธ์ที่ได้จากกลุ่มตัวอย่างเป็นตัวแทนของทั้งกลุ่ม? หรือหากต้องการใช้คำศัพท์เฉพาะทาง เราจะแน่ใจได้อย่างไรว่างานวิจัยของเราจะอธิบายเนื้อหาทั้งหมดได้อย่างถูกต้อง ประชากรตัวอย่างที่เราใช้?
เพื่อตอบคำถามนี้ จำเป็นต้องกำหนดนัยสำคัญทางสถิติของผลการทดสอบ นัยสำคัญทางสถิติ (ระดับสำคัญ, ย่อ ซิก)หรือ /7-ระดับนัยสำคัญ (ระดับ p) -คือความน่าจะเป็นนั้น ผลลัพธ์นี้แสดงถึงประชากรที่สุ่มตัวอย่างการศึกษาอย่างถูกต้อง โปรดทราบว่านี่เป็นเพียง ความน่าจะเป็น- เป็นไปไม่ได้ที่จะพูดด้วยการรับประกันอย่างแน่นอน การศึกษาครั้งนี้อธิบายประชากรทั้งหมดได้อย่างถูกต้อง ระดับนัยสำคัญสามารถสรุปได้ว่ามีความเป็นไปได้สูง จึงเกิดขึ้นอย่างหลีกเลี่ยงไม่ได้ คำถามถัดไป: ต้องมีความสำคัญระดับใดจึงจะถือว่าผลลัพธ์นี้เป็นลักษณะที่ถูกต้องของประชากรได้
ตัวอย่างเช่น คุณยินดีที่จะบอกว่าโอกาสดังกล่าวเพียงพอที่จะรับความเสี่ยงที่ค่าความน่าจะเป็นเท่าใด จะเกิดอะไรขึ้นถ้าอัตราต่อรองคือ 10 จาก 100 หรือ 50 จาก 100? จะเกิดอะไรขึ้นถ้าความน่าจะเป็นนี้สูงกว่า? แล้วอัตราต่อรองเช่น 90 จาก 100, 95 จาก 100 หรือ 98 จาก 100 ล่ะ? สำหรับสถานการณ์ที่เกี่ยวข้องกับความเสี่ยง ทางเลือกนี้ค่อนข้างเป็นปัญหาเนื่องจากขึ้นอยู่กับลักษณะส่วนบุคคลของบุคคล
ในทางจิตวิทยา เชื่อกันว่าโอกาส 95 หรือมากกว่าใน 100 หมายความว่าความน่าจะเป็นของผลลัพธ์ที่ถูกต้องนั้นสูงพอที่จะทำให้ประชากรทั้งหมดสามารถสรุปได้ทั่วไป ตัวเลขนี้ก่อตั้งขึ้นในกระบวนการของกิจกรรมทางวิทยาศาสตร์และการปฏิบัติ - ไม่มีกฎหมายที่ควรเลือกเป็นแนวทาง (และแน่นอนว่าในวิทยาศาสตร์อื่นบางครั้งค่าอื่น ๆ ของระดับนัยสำคัญก็ถูกเลือก)
ในทางจิตวิทยา พวกเขาดำเนินการด้วยความน่าจะเป็นนี้หลายครั้ง ในลักษณะที่ไม่ธรรมดา- แทนที่จะเป็นความน่าจะเป็นที่กลุ่มตัวอย่างแสดงถึงประชากร ความน่าจะเป็นที่กลุ่มตัวอย่าง ไม่ได้เป็นตัวแทนประชากร. กล่าวอีกนัยหนึ่ง คือความน่าจะเป็นที่ความสัมพันธ์หรือความแตกต่างที่สังเกตได้นั้นเป็นแบบสุ่มและไม่ใช่สมบัติของประชากร ดังนั้น แทนที่จะบอกว่ามีโอกาส 95 ใน 100 ที่ผลการศึกษาถูกต้อง นักจิตวิทยากลับบอกว่ามีโอกาส 5 ใน 100 ที่ผลการศึกษาจะผิด (เช่นเดียวกับโอกาส 40 ใน 100 ที่ผลการศึกษาจะถูกต้องก็หมายความว่า มีโอกาส 60 ใน 100 ที่จะสนับสนุนความผิดพลาด) บางครั้งค่าความน่าจะเป็นจะแสดงเป็นเปอร์เซ็นต์ แต่มักจะเขียนเป็น ทศนิยม- ตัวอย่างเช่น โอกาส 10 ใน 100 จะแสดงเป็นเศษส่วนทศนิยม 0.1 5 จาก 100 เขียนเป็น 0.05; 1 จาก 100 - 0.01 ด้วยรูปแบบการบันทึกนี้ ค่าขีดจำกัดคือ 0.05 ผลที่จะถือว่าถูกต้องจะต้องมีระดับนัยสำคัญ ด้านล่างตัวเลขนี้ (จำไว้ว่านี่คือความน่าจะเป็นที่ผลลัพธ์ ผิดอธิบายถึงประชากร) เพื่อขจัดคำศัพท์ เราจะเพิ่มว่า "ความน่าจะเป็นของผลลัพธ์ที่ไม่ถูกต้อง" (ซึ่งเรียกได้ถูกต้องกว่า ระดับนัยสำคัญ)มักจะแสดงแทน อักษรละติน ร.คำอธิบายของผลการทดลองมักจะมีข้อความสรุป เช่น “ผลลัพธ์มีนัยสำคัญที่ระดับความเชื่อมั่น” (หน้า(p) น้อยกว่า 0.05 (เช่น น้อยกว่า 5%)
ดังนั้นระดับนัยสำคัญ ( ร) บ่งบอกถึงความน่าจะเป็นของผลลัพธ์ ไม่เป็นตัวแทนของประชากร ตามเนื้อผ้าในด้านจิตวิทยาเชื่อกันว่าผลลัพธ์สะท้อนได้อย่างน่าเชื่อถือ ภาพใหญ่ถ้ามีค่า รน้อยกว่า 0.05 (เช่น 5%) อย่างไรก็ตาม นี่เป็นเพียงข้อความแสดงความน่าจะเป็นเท่านั้น และไม่ใช่การรับประกันแบบไม่มีเงื่อนไขแต่อย่างใด ในบางกรณีข้อสรุปนี้อาจไม่ถูกต้อง ในความเป็นจริง เราสามารถคำนวณได้ว่าเหตุการณ์นี้อาจเกิดขึ้นได้บ่อยเพียงใดหากเราพิจารณาขนาดของระดับนัยสำคัญ ที่ระดับนัยสำคัญ 0.05 ผลลัพธ์ 5 ใน 100 ครั้งมีแนวโน้มที่จะไม่ถูกต้อง เมื่อมองแวบแรก 11a ดูเหมือนว่านี่จะไม่ธรรมดานัก แต่ถ้าคุณคิดดูดีๆ โอกาส 5 ใน 100 ก็เท่ากับ 1 ใน 20 หรืออีกนัยหนึ่ง หนึ่งในทุกๆ 20 กรณีผลลัพธ์จะเป็น ไม่ถูกต้อง. โอกาสดังกล่าวดูเหมือนจะไม่ค่อยดีนัก และนักวิจัยควรระวังในการดำเนินการ ข้อผิดพลาดประเภทแรกนี่คือชื่อของข้อผิดพลาดที่เกิดขึ้นเมื่อนักวิจัยคิดว่าพบผลลัพธ์ที่แท้จริงแล้ว แต่ในความเป็นจริงกลับไม่พบ ข้อผิดพลาดตรงกันข้ามซึ่งประกอบด้วยนักวิจัยที่เชื่อว่าไม่พบผลลัพธ์เมื่อมีอยู่จริงเรียกว่า ข้อผิดพลาดประเภทที่สอง
ข้อผิดพลาดเหล่านี้เกิดขึ้นเนื่องจากความเป็นไปได้ที่การวิเคราะห์ทางสถิติดำเนินการไม่สามารถตัดออกได้ ความน่าจะเป็นของข้อผิดพลาดขึ้นอยู่กับระดับนัยสำคัญทางสถิติของผลลัพธ์ เราได้สังเกตแล้วว่าเพื่อให้พิจารณาผลลัพธ์ที่ถูกต้อง ระดับนัยสำคัญต้องต่ำกว่า 0.05 แน่นอนว่าผลลัพธ์บางอย่างมากกว่านั้น ระดับต่ำและไม่ใช่เรื่องแปลกที่จะพบผลลัพธ์ที่ต่ำถึง 0.001 (ค่า 0.001 บ่งชี้ว่าผลลัพธ์มีโอกาสผิดพลาด 1 ใน 1,000) ยังไง มูลค่าน้อยลง p ยิ่งเรามั่นใจในความถูกต้องของผลลัพธ์มากขึ้นเท่านั้น
ในตาราง 7.2 แสดงการตีความระดับนัยสำคัญแบบดั้งเดิมเกี่ยวกับความเป็นไปได้ของการอนุมานทางสถิติและเหตุผลในการตัดสินใจเกี่ยวกับการมีความสัมพันธ์ (ความแตกต่าง)
ตารางที่ 7.2
การตีความระดับนัยสำคัญที่ใช้ในจิตวิทยาแบบดั้งเดิม
ขอแนะนำจากประสบการณ์การวิจัยเชิงปฏิบัติ: เพื่อหลีกเลี่ยงข้อผิดพลาดประเภทที่หนึ่งและสองให้มากที่สุดเมื่อทำการสรุปที่สำคัญควรทำการตัดสินใจเกี่ยวกับการมีความแตกต่าง (การเชื่อมต่อ) โดยเน้นที่ระดับ รเครื่องหมายไม่มี
การทดสอบทางสถิติ(การทดสอบทางสถิติ -เป็นเครื่องมือในการกำหนดระดับนัยสำคัญทางสถิติ นี่เป็นกฎชี้ขาดที่ทำให้แน่ใจว่าสมมติฐานที่แท้จริงได้รับการยอมรับ และสมมติฐานเท็จจะถูกปฏิเสธด้วยความน่าจะเป็นสูง
เกณฑ์ทางสถิติยังแสดงถึงวิธีการคำนวณจำนวนหนึ่งและจำนวนนั้นด้วย เกณฑ์ทั้งหมดใช้เพื่อวัตถุประสงค์หลักประการเดียว: เพื่อกำหนด ระดับนัยสำคัญข้อมูลที่พวกเขาวิเคราะห์ (เช่น ความน่าจะเป็นที่ข้อมูลจะสะท้อนถึงผลกระทบที่แท้จริงซึ่งแสดงถึงประชากรที่ใช้สุ่มตัวอย่างอย่างถูกต้อง)
การทดสอบบางอย่างสามารถใช้ได้เฉพาะกับข้อมูลที่แจกแจงแบบปกติเท่านั้น (และหากลักษณะถูกวัดเป็นช่วง) การทดสอบเหล่านี้มักจะเรียกว่า พารามิเตอร์เมื่อใช้เกณฑ์อื่นคุณสามารถวิเคราะห์ข้อมูลได้เกือบทุกกฎหมายการกระจาย - เรียกว่า ไม่ใช่พารามิเตอร์
เกณฑ์พาราเมตริกคือเกณฑ์ที่รวมพารามิเตอร์การกระจายไว้ในสูตรการคำนวณ เช่น ค่าเฉลี่ยและความแปรปรวน (การทดสอบของนักเรียน, การทดสอบ F ของฟิชเชอร์ ฯลฯ )
เกณฑ์ที่ไม่ใช่พารามิเตอร์คือเกณฑ์ที่ไม่รวมพารามิเตอร์การกระจายในสูตรสำหรับการคำนวณพารามิเตอร์การกระจาย และขึ้นอยู่กับการทำงานกับความถี่หรืออันดับ (เกณฑ์ ถามเกณฑ์ Rosenbaum คุณมานา-วิทนีย์
ตัวอย่างเช่น เมื่อเราบอกว่าความสำคัญของความแตกต่างถูกกำหนดโดยการทดสอบทีของนักเรียน เราหมายถึงว่าวิธีการทดสอบทีของนักเรียนนั้นใช้ในการคำนวณค่าเชิงประจักษ์ ซึ่งจากนั้นจะถูกนำไปเปรียบเทียบกับค่าในตาราง (วิกฤต)
ด้วยอัตราส่วนของเชิงประจักษ์ (คำนวณโดยเรา) และค่าวิกฤตของเกณฑ์ (ตาราง) เราสามารถตัดสินได้ว่าสมมติฐานของเราได้รับการยืนยันหรือหักล้างหรือไม่ ในกรณีส่วนใหญ่ เพื่อให้เรารับรู้ถึงความแตกต่างที่มีนัยสำคัญ จำเป็นที่ค่าเชิงประจักษ์ของเกณฑ์จะต้องมากกว่าค่าวิกฤติ แม้ว่าจะมีเกณฑ์ (เช่น การทดสอบแมนน์-วิทนีย์ หรือการทดสอบเครื่องหมาย) ซึ่ง เราต้องปฏิบัติตามกฎที่ตรงกันข้าม
ในบางกรณี สูตรการคำนวณสำหรับเกณฑ์จะรวมจำนวนการสังเกตในกลุ่มตัวอย่างที่กำลังศึกษาด้วย แสดงเป็น พี เมื่อใช้ตารางพิเศษ เราจะพิจารณาว่าระดับนัยสำคัญทางสถิติของความแตกต่างซึ่งค่าเชิงประจักษ์ที่กำหนดนั้นสอดคล้องกับระดับใด ในกรณีส่วนใหญ่ ค่าเชิงประจักษ์ที่เท่ากันของเกณฑ์อาจมีนัยสำคัญหรือไม่มีนัยสำคัญ ขึ้นอยู่กับจำนวนการสังเกตในกลุ่มตัวอย่างภายใต้การศึกษา ( n ) หรือจากสิ่งที่เรียกว่า จำนวนองศาอิสระ ซึ่งแสดงเป็น โวลต์ (g>) หรืออย่างไร df (บางครั้ง ง)
รู้ nหรือจำนวนระดับความเป็นอิสระโดยใช้ตารางพิเศษ (ตารางหลักได้รับในภาคผนวก 5) เราสามารถกำหนดค่าวิกฤตของเกณฑ์และเปรียบเทียบค่าเชิงประจักษ์ที่ได้รับกับค่าเหล่านั้น โดยปกติจะเขียนดังนี้: “เมื่อใด” น=ค่าวิกฤต 22 ค่าของเกณฑ์คือ เสื้อ เซนต์ = 2.07" หรือ "ที่ โวลต์ (ง) = ค่าวิกฤต 2 ค่าของแบบทดสอบของนักเรียนคือ = 4.30” เป็นต้น
โดยทั่วไปแล้ว การตั้งค่าจะยังคงเป็นไปตามเกณฑ์แบบพาราเมตริก และเรายึดถือตำแหน่งนี้ ถือว่ามีความน่าเชื่อถือมากกว่าและสามารถให้ข้อมูลและการวิเคราะห์เชิงลึกได้มากขึ้น ส่วนความซับซ้อนของการคำนวณทางคณิตศาสตร์เมื่อใช้ โปรแกรมคอมพิวเตอร์ความยากลำบากนี้หายไป (แต่บางส่วนก็ปรากฏว่าสามารถเอาชนะได้)
- ในตำราเรียนเล่มนี้เราไม่ได้พิจารณารายละเอียดปัญหาทางสถิติ
- สมมติฐาน (null - R0 และทางเลือก - Hj) และการตัดสินใจทางสถิติเนื่องจากนักศึกษาจิตวิทยาศึกษาสิ่งนี้แยกกันในสาขาวิชา "วิธีทางคณิตศาสตร์ในด้านจิตวิทยา" นอกจากนี้ควรสังเกตด้วยว่าเมื่อจัดทำรายงานการวิจัย (รายวิชาหรือ วิทยานิพนธ์, สิ่งพิมพ์) ไม่ได้รับสมมติฐานทางสถิติและวิธีแก้ปัญหาทางสถิติตามกฎ โดยปกติเมื่ออธิบายผลลัพธ์จะมีการระบุเกณฑ์ให้ระบุสถิติเชิงพรรณนาที่จำเป็น (หมายถึง, ซิกม่า, สัมประสิทธิ์สหสัมพันธ์ ฯลฯ ), ค่าเชิงประจักษ์ของเกณฑ์, ระดับความเป็นอิสระและจำเป็นต้องมีระดับนัยสำคัญ p . จากนั้นจะมีการกำหนดข้อสรุปที่มีความหมายเกี่ยวกับสมมติฐานที่กำลังทดสอบ โดยระบุ (โดยปกติจะอยู่ในรูปแบบของความไม่เท่าเทียมกัน) ระดับนัยสำคัญที่บรรลุผลสำเร็จหรือไม่บรรลุผล
ความน่าเชื่อถือทางสถิติถือเป็นสิ่งสำคัญในการฝึกคำนวณของ FCC ก่อนหน้านี้มีข้อสังเกตว่าสามารถเลือกตัวอย่างได้หลายตัวอย่างจากประชากรกลุ่มเดียวกัน:
หากเลือกอย่างถูกต้องตัวบ่งชี้เฉลี่ยและตัวบ่งชี้ของประชากรทั่วไปจะแตกต่างกันเล็กน้อยจากขนาดของข้อผิดพลาดในการเป็นตัวแทนโดยคำนึงถึงความน่าเชื่อถือที่ยอมรับได้
หากเลือกจากประชากรที่แตกต่างกัน ความแตกต่างระหว่างพวกเขาจะกลายเป็นเรื่องสำคัญ สถิติเป็นเรื่องเกี่ยวกับการเปรียบเทียบตัวอย่าง
หากพวกเขาแตกต่างกันอย่างไม่มีนัยสำคัญ ไม่มีหลักการ ไม่มีนัยสำคัญ กล่าวคือ จริงๆ แล้วพวกเขาอยู่ในประชากรทั่วไปกลุ่มเดียวกัน ความแตกต่างระหว่างพวกเขาเรียกว่าไม่น่าเชื่อถือทางสถิติ
มีความน่าเชื่อถือทางสถิติ ความแตกต่างของกลุ่มตัวอย่างคือกลุ่มตัวอย่างที่แตกต่างกันอย่างมีนัยสำคัญและเป็นพื้นฐาน กล่าวคือ เป็นของกลุ่มประชากรทั่วไปที่แตกต่างกัน
การประเมินของ FCC นัยสำคัญทางสถิติความแตกต่างของตัวอย่างหมายถึงการแก้ปัญหาเชิงปฏิบัติหลายอย่าง ตัวอย่างเช่น การแนะนำวิธีการสอน โปรแกรม ชุดแบบฝึกหัด แบบทดสอบ แบบฝึกหัดควบคุมใหม่ๆ เชื่อมโยงกับการทดสอบเชิงทดลอง ซึ่งควรแสดงให้เห็นว่ากลุ่มทดสอบมีความแตกต่างโดยพื้นฐานจากกลุ่มควบคุม ดังนั้นจึงใช้วิธีการทางสถิติพิเศษที่เรียกว่าเกณฑ์ที่มีนัยสำคัญทางสถิติ เพื่อตรวจหาการมีหรือไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างตัวอย่าง
เกณฑ์ทั้งหมดแบ่งออกเป็นสองกลุ่ม: แบบอิงพารามิเตอร์และแบบไม่มีพารามิเตอร์ เกณฑ์พาราเมตริกกำหนดให้ต้องมีกฎหมายการแจกแจงแบบปกติ เช่น นี่หมายถึงการกำหนดตัวบ่งชี้หลักของกฎปกติ - ค่าเฉลี่ยเลขคณิตและค่าเบี่ยงเบนมาตรฐาน เกณฑ์พาราเมตริกมีความแม่นยำและถูกต้องที่สุด การทดสอบแบบไม่อิงพารามิเตอร์จะขึ้นอยู่กับความแตกต่างอันดับ (ลำดับ) ระหว่างองค์ประกอบตัวอย่าง
ต่อไปนี้เป็นเกณฑ์หลักสำหรับนัยสำคัญทางสถิติที่ใช้ในการฝึก FCC: การทดสอบของนักเรียนและการทดสอบของฟิชเชอร์
การทดสอบของนักเรียนตั้งชื่อตามนักวิทยาศาสตร์ชาวอังกฤษ K. Gosset (นักเรียน - นามแฝง) ผู้ค้นพบวิธีนี้ การทดสอบของนักเรียนเป็นแบบพาราเมตริกและใช้สำหรับการเปรียบเทียบ ตัวชี้วัดที่แน่นอนตัวอย่าง ตัวอย่างอาจมีขนาดแตกต่างกัน
การทดสอบของนักเรียน ถูกกำหนดเช่นนี้
1. ค้นหาแบบทดสอบ Student โดยใช้สูตรต่อไปนี้:
ค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่างที่เปรียบเทียบอยู่ที่ไหน เสื้อ 1, เสื้อ 2 - ข้อผิดพลาดของการเป็นตัวแทนที่ระบุตามตัวบ่งชี้ของกลุ่มตัวอย่างที่เปรียบเทียบ
2. การปฏิบัติที่ FCC แสดงให้เห็นว่าสำหรับงานกีฬาก็เพียงพอที่จะยอมรับความน่าเชื่อถือของบัญชี P = 0.95
ความน่าเชื่อถือในการนับ: P = 0.95 (a = 0.05) พร้อมจำนวนองศาอิสระ
k = n 1 + n 2 - 2 จากตารางในภาคผนวก 4 เราค้นหาค่าของค่าขีด จำกัด ของเกณฑ์ ( ทีกรัม).
3. ขึ้นอยู่กับคุณสมบัติของกฎการกระจายแบบปกติ เกณฑ์ของนักเรียนจะเปรียบเทียบ t และ t gr
เราได้ข้อสรุป:
ถ้า t t gr ความแตกต่างระหว่างตัวอย่างที่เปรียบเทียบนั้นมีนัยสำคัญทางสถิติ
หากไม่ได้หมายความว่าความแตกต่างนั้นไม่มีนัยสำคัญทางสถิติ
สำหรับนักวิจัยในสาขา FCS การประเมินนัยสำคัญทางสถิติเป็นขั้นตอนแรกในการแก้ปัญหาเฉพาะเจาะจง ไม่ว่าตัวอย่างที่เปรียบเทียบจะมีความแตกต่างกันโดยพื้นฐานหรือไม่ก็ตาม ขั้นตอนต่อไปคือการประเมินความแตกต่างนี้จากมุมมองการสอนซึ่งกำหนดโดยเงื่อนไขของงาน
ลองพิจารณาการประยุกต์ใช้แบบทดสอบนักเรียนโดยใช้ตัวอย่างเฉพาะ
ตัวอย่างที่ 2.14 กลุ่มตัวอย่าง 18 คนได้รับการประเมินอัตราการเต้นของหัวใจ (bpm) ก่อน x i และหลัง ใช่แล้วอุ่นเครื่อง
ประเมินประสิทธิผลของการวอร์มอัพตามอัตราการเต้นของหัวใจ ข้อมูลเบื้องต้นและการคำนวณแสดงไว้ในตาราง 2.30 และ 2.31 น.
ตารางที่ 2.30
การประมวลผลตัวบ่งชี้อัตราการเต้นของหัวใจก่อนอบอุ่นร่างกาย
ข้อผิดพลาดสำหรับทั้งสองกลุ่มเกิดขึ้นพร้อมกัน เนื่องจากขนาดตัวอย่างเท่ากัน (กลุ่มเดียวกันได้รับการศึกษาภายใต้เงื่อนไขที่ต่างกัน) และค่าเบี่ยงเบนมาตรฐานคือ s x = s y = 3 ครั้ง/นาที มาดูการกำหนดการทดสอบของนักเรียนกันดีกว่า:
เราตั้งค่าความน่าเชื่อถือของบัญชี: P = 0.95
จำนวนองศาอิสระ k 1 = n 1 + n 2 - 2 = 18 + 18-2 = 34 จากตารางในภาคผนวก 4 เราพบ ทีกรัม= 2,02.
การอนุมานทางสถิติ เนื่องจาก t = 11.62 และขอบเขต t gr = 2.02 จากนั้น 11.62 > 2.02 เช่น t > t gr ดังนั้นความแตกต่างระหว่างกลุ่มตัวอย่างจึงมีนัยสำคัญทางสถิติ
ข้อสรุปการสอน พบว่าในแง่ของอัตราการเต้นของหัวใจ ความแตกต่างระหว่างสถานะของกลุ่มก่อนและหลังการอบอุ่นร่างกายมีนัยสำคัญทางสถิติ กล่าวคือ สำคัญและเป็นพื้นฐาน ดังนั้น จากตัวบ่งชี้อัตราการเต้นของหัวใจ เราสามารถสรุปได้ว่าการวอร์มอัพมีประสิทธิผล
เกณฑ์ฟิชเชอร์เป็นพารามิเตอร์ ใช้ในการเปรียบเทียบอัตราการกระจายตัวของตัวอย่าง ซึ่งมักจะหมายถึงการเปรียบเทียบในแง่ของความเสถียรของประสิทธิภาพการกีฬาหรือความเสถียรของตัวบ่งชี้การทำงานและทางเทคนิคในทางปฏิบัติ วัฒนธรรมทางกายภาพและกีฬา ตัวอย่างอาจมีขนาดแตกต่างกัน
เกณฑ์ฟิชเชอร์ถูกกำหนดตามลำดับต่อไปนี้
1. ค้นหาเกณฑ์ฟิชเชอร์ F โดยใช้สูตร
โดยที่ คือความแปรปรวนของกลุ่มตัวอย่างที่เปรียบเทียบ
เงื่อนไขของเกณฑ์ฟิชเชอร์กำหนดไว้ในตัวเศษของสูตร เอฟ มีการกระจายตัวมากเช่น จำนวน F จะมากกว่าหนึ่งเสมอ
เราตั้งค่าความน่าเชื่อถือของการนับ: P = 0.95 - และกำหนดจำนวนองศาอิสระสำหรับทั้งสองตัวอย่าง: k 1 = n 1 - 1, k 2 = n 2 - 1
เมื่อใช้ตารางในภาคผนวก 4 เราจะค้นหาค่าขีดจำกัดของเกณฑ์ F กรัม.
การเปรียบเทียบเกณฑ์ F และ F กรัมช่วยให้เราสามารถสรุปได้:
ถ้า F > F gr ความแตกต่างระหว่างกลุ่มตัวอย่างจะมีนัยสำคัญทางสถิติ
ถ้า F< F гр, то различие между выборками статически недостоверно.
ลองยกตัวอย่างที่เฉพาะเจาะจง
ตัวอย่าง 2.15. มาวิเคราะห์ผู้เล่นแฮนด์บอลสองกลุ่ม: x ฉัน (หมายเลข 1= 16 คน) และ y i (n 2 = 18 คน) นักกีฬากลุ่มเหล่านี้ได้รับการศึกษาเกี่ยวกับเวลาขึ้นเครื่องเมื่อขว้างลูกบอลเข้าประตู
ตัวบ่งชี้แรงผลักเป็นประเภทเดียวกันหรือไม่?
ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.32 และ 2.33
ตารางที่ 2.32
การประมวลผลตัวบ่งชี้การขับไล่ของผู้เล่นแฮนด์บอลกลุ่มแรก
ให้เรากำหนดเกณฑ์ฟิชเชอร์:
ตามข้อมูลที่นำเสนอในตารางภาคผนวก 6 เราพบ Fgr: Fgr = 2.4
ให้เราใส่ใจกับความจริงที่ว่าในตารางในภาคผนวก 6 รายการของจำนวนระดับความอิสระของการกระจายทั้งที่มากขึ้นและเล็กจะหยาบมากขึ้นเมื่อเราเข้าใกล้ตัวเลขที่มากขึ้น ดังนั้นจำนวนองศาความเป็นอิสระของการกระจายตัวที่มากขึ้นตามลำดับนี้: 8, 9, 10, 11, 12, 14, 16, 20, 24 เป็นต้น และอันที่เล็กกว่า - 28, 29, 30, 40 , 50 ฯลฯ ง.
สิ่งนี้อธิบายได้จากข้อเท็จจริงที่ว่าเมื่อขนาดตัวอย่างเพิ่มขึ้น ความแตกต่างในการทดสอบ F จะลดลง และคุณสามารถใช้ค่าแบบตารางที่ใกล้เคียงกับข้อมูลต้นฉบับได้ ดังนั้น ในตัวอย่าง 2.15 =17 หายไป และค่าที่ใกล้เคียงที่สุดสามารถหาได้เป็น k = 16 ซึ่งเราจะได้ Fgr = 2.4
การอนุมานทางสถิติ เนื่องจากการทดสอบของฟิชเชอร์ F= 2.5 > F= 2.4 ตัวอย่างจึงสามารถแยกแยะได้อย่างมีนัยสำคัญทางสถิติ
ข้อสรุปการสอน ค่าของเวลาออกตัวเมื่อโยนบอลเข้าประตูสำหรับผู้เล่นแฮนด์บอลของทั้งสองกลุ่มแตกต่างกันอย่างมีนัยสำคัญ กลุ่มเหล่านี้ควรได้รับการพิจารณาที่แตกต่างกัน
การวิจัยเพิ่มเติมควรเปิดเผยสาเหตุของความแตกต่างนี้
ตัวอย่าง 2.20.(เกี่ยวกับความน่าเชื่อถือทางสถิติของกลุ่มตัวอย่าง - คุณสมบัติของนักฟุตบอลจะดีขึ้นหรือไม่หากเวลาจากการให้สัญญาณในการเตะบอลในช่วงเริ่มต้นการฝึกคือ x i และในตอนท้าย y i
ข้อมูลเบื้องต้นและการคำนวณพื้นฐานแสดงไว้ในตาราง 2.40 และ 2.41
ตารางที่ 2.40
ตัวบ่งชี้เวลาในการประมวลผลจากการให้สัญญาณในการตีลูกบอลเมื่อเริ่มการฝึกซ้อม
ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของนักเรียน:
ด้วยความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = n 1 + n 2 - 2 = 22 + 22 - 2 = 42 โดยใช้ตารางในภาคผนวก 4 เราพบ ทีกรัม= 2.02. เนื่องจาก t = 8.3 > ทีกรัม= 2.02 - ความแตกต่างมีนัยสำคัญทางสถิติ
ให้เราพิจารณาความแตกต่างระหว่างกลุ่มตัวบ่งชี้โดยใช้เกณฑ์ของฟิชเชอร์:
ตามตารางในภาคผนวก 2 โดยมีความน่าเชื่อถือ P = 0.95 และองศาอิสระ k = 22-1 = 21 ค่า F gr = 21 เนื่องจาก F = 1.53< F гр = = 2,1, различие в рассеивании исходных данных статистически недостоверно.
การอนุมานทางสถิติ ตามค่าเฉลี่ยเลขคณิต ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้มีนัยสำคัญทางสถิติ ในแง่ของการกระจายตัว (dispersion) ความแตกต่างระหว่างกลุ่มของตัวบ่งชี้นั้นไม่น่าเชื่อถือทางสถิติ
ข้อสรุปการสอนคุณสมบัติของนักฟุตบอลได้รับการปรับปรุงอย่างมีนัยสำคัญ แต่ควรให้ความสนใจกับความมั่นคงของคำให้การของเขา
การเตรียมงาน
ก่อนหน้านี้ งานห้องปฏิบัติการในสาขาวิชา “มาตรวิทยาการกีฬา” ถึงนักเรียนทุกคน กลุ่มการศึกษามีความจำเป็นต้องจัดตั้งทีมงานจำนวน 3-4 คนในแต่ละกลุ่มเพื่อร่วมกันมอบหมายงานงานห้องปฏิบัติการทั้งหมดให้เสร็จสิ้น
ในการเตรียมงาน อ่านส่วนที่เกี่ยวข้องของวรรณกรรมที่แนะนำ (ดูหัวข้อที่ 6 ของข้อมูล คำแนะนำระเบียบวิธี) และบันทึกการบรรยาย ศึกษาส่วนที่ 1 และ 2 สำหรับงานในห้องปฏิบัติการนี้ ตลอดจนการมอบหมายงาน (ส่วนที่ 4)
เตรียมแบบฟอร์มรายงานบนกระดาษเขียนขนาด A4 มาตรฐาน และเติมวัสดุที่จำเป็นสำหรับการทำงาน
โดยในรายงานจะต้องมี :
หน้าแรกโดยระบุแผนก (UC และ TR) กลุ่มวิชา นามสกุล ชื่อจริง นามสกุลของนักศึกษา หมายเลขและชื่อผลงานห้องปฏิบัติการ วันที่สำเร็จการศึกษา ตลอดจนนามสกุล ปริญญาทางวิชาการ ตำแหน่งทางวิชาการ และตำแหน่ง ครูรับงาน;
วัตถุประสงค์ของงาน
สูตรที่มีค่าตัวเลขอธิบายผลการคำนวณขั้นกลางและขั้นสุดท้าย
ตารางค่าที่วัดและคำนวณได้
วัสดุกราฟิกที่จำเป็นสำหรับงาน;
ข้อสรุปโดยย่อขึ้นอยู่กับผลลัพธ์ของแต่ละขั้นตอนของการมอบหมายงานและโดยทั่วไปของงานที่ทำ
กราฟและตารางทั้งหมดถูกวาดอย่างระมัดระวังโดยใช้เครื่องมือวาดภาพ สัญลักษณ์กราฟิกและตัวอักษรทั่วไปต้องเป็นไปตาม GOST อนุญาตให้จัดทำรายงานโดยใช้เทคโนโลยีคอมพิวเตอร์ได้
การมอบหมายงาน
ก่อนที่จะดำเนินการวัดทั้งหมด สมาชิกในทีมแต่ละคนจะต้องศึกษากฎการใช้งาน เกมกีฬาลูกดอกที่ให้ไว้ในภาคผนวก 7 ซึ่งจำเป็นสำหรับการดำเนินการวิจัยในขั้นตอนต่อไปนี้
ระยะที่ 1 ของการวิจัย“การศึกษาผลการตีเป้าหมายของเกมกีฬาปาเป้าโดยสมาชิกแต่ละคนในทีมเพื่อให้เป็นไปตามกฎหมายการกระจายสินค้าตามปกติตามหลักเกณฑ์ χ 2เพียร์สันและเกณฑ์สามซิกมา"
1. วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำ ด้วยการขว้างปาเป้า 30-40 ครั้งไปที่เป้าหมายวงกลมในเกมกีฬาปาเป้า
2. ผลการวัด (การทดสอบ) x ฉัน(ในแก้ว) จัดรูปแบบในรูปแบบของชุดรูปแบบและป้อนลงในตาราง 4.1 (คอลัมน์ ทำการคำนวณที่จำเป็นทั้งหมด กรอกตารางที่จำเป็นและสรุปผลที่เหมาะสมเกี่ยวกับการปฏิบัติตามผลการแจกแจงเชิงประจักษ์ที่เกิดขึ้นกับกฎหมายการกระจายแบบปกติโดย การเปรียบเทียบกับการคำนวณ ตาราง และข้อสรุปที่คล้ายกันของตัวอย่าง 2.12 ที่ให้ไว้ในส่วนที่ 2 ของแนวทางเหล่านี้ในหน้า 7 - 10
ตารางที่ 4.1
ความสอดคล้องของความเร็วและการประสานงานของการกระทำของอาสาสมัครกับกฎหมายการกระจายแบบปกติ
เลขที่ | โค้งมน | |||||||||
… | ||||||||||
… | ||||||||||
ทั้งหมด |
II – ขั้นตอนการวิจัย
“การประเมินตัวบ่งชี้เฉลี่ยของประชากรทั่วไปในการโจมตีเป้าหมายของเกมกีฬาปาเป้าของนักเรียนทุกคนในกลุ่มเรียนโดยพิจารณาจากผลการวัดของสมาชิกของทีมเดียว”
ประเมินตัวบ่งชี้ความเร็วเฉลี่ยและการประสานงานของการกระทำของนักเรียนทุกคนในกลุ่มการศึกษา (ตามรายชื่อกลุ่มการศึกษาในนิตยสารชั้นเรียน) ตามผลการตีเป้าหมายปาเป้าของสมาชิกในทีมทั้งหมดที่ได้รับในระยะแรก ของงานวิจัยในห้องปฏิบัติการนี้
1. บันทึกผลการวัดความเร็วและการประสานงานของการกระทำ เมื่อขว้างปาเป้าไปที่เป้าหมายวงกลมในเกมกีฬา ปาเป้าของสมาชิกทุกคนในทีมของคุณ (2 - 4 คน) ซึ่งเป็นตัวอย่างผลการวัดจากประชากรทั่วไป (ผลการวัดของนักเรียนทุกคนในกลุ่มเรียน - เช่น จำนวน 15 คน) โดยระบุในคอลัมน์ที่สองและสาม ตารางที่ 4.2
ตารางที่ 4.2
ตัวชี้วัดการประมวลผลความเร็วและการประสานงานของการกระทำ
สมาชิกกองพลน้อย
เลขที่ | ||||||
… | ||||||
… | ||||||
ทั้งหมด |
ในตาราง 4.2 ภายใต้ ควรจะเข้าใจ , คะแนนเฉลี่ยที่ตรงกัน (ดูผลการคำนวณในตารางที่ 4.1) สมาชิกในทีมของคุณ ( , ได้รับในขั้นตอนแรกของการวิจัย ควรสังเกตว่า ตามกฎแล้ว ตาราง 4.2 ประกอบด้วยค่าเฉลี่ยที่คำนวณได้ของผลการวัดที่ได้รับโดยสมาชิกคนหนึ่งในทีมในขั้นตอนแรกของการวิจัย เนื่องจากโอกาสที่ผลการวัดของสมาชิกในทีมแต่ละคนจะตรงกันนั้นมีน้อยมาก แล้ว, ตามกฎแล้วค่าต่างๆ ในคอลัมน์ ตารางที่ 4.2 สำหรับแต่ละแถว - เท่ากับ 1 ก ในบรรทัด “ยอดรวม " คอลัมน์ " " ถูกเขียน จำนวนสมาชิกในทีมของคุณ
2. ทำการคำนวณที่จำเป็นทั้งหมดเพื่อกรอกตาราง 4.2 รวมถึงการคำนวณและข้อสรุปอื่น ๆ ที่คล้ายกับการคำนวณและข้อสรุปของตัวอย่าง 2.13 ที่ให้ไว้ในส่วนที่ 2 ของสิ่งนี้ การพัฒนาระเบียบวิธีในหน้า 13-14. ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" มีความจำเป็นต้องใช้สูตร 2.4 ที่ให้ไว้ในหน้า 13 ของการพัฒนาวิธีการนี้เนื่องจากกลุ่มตัวอย่างมีขนาดเล็ก (n และจำนวนองค์ประกอบของประชากรทั่วไป N เป็นที่รู้จักและเท่ากับจำนวนนักเรียนในกลุ่มการศึกษา ตามรายชื่อวารสารของกลุ่มศึกษา
III – ขั้นตอนการวิจัย
การประเมินประสิทธิผลของการวอร์มอัพตามตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” โดยสมาชิกในทีมแต่ละคนโดยใช้แบบทดสอบของนักเรียน
เพื่อประเมินประสิทธิผลของการวอร์มอัพสำหรับการขว้างลูกดอกไปยังเป้าหมายของเกมกีฬา "ปาเป้า" ซึ่งดำเนินการในขั้นตอนแรกของการวิจัยของงานในห้องปฏิบัติการนี้โดยสมาชิกแต่ละคนในทีมตามตัวบ่งชี้ "ความเร็วและ การประสานงานของการกระทำ" โดยใช้เกณฑ์ของนักเรียน - เกณฑ์พาราเมตริกสำหรับความน่าเชื่อถือทางสถิติของกฎการกระจายเชิงประจักษ์กับกฎการกระจายแบบปกติ
2. ความแตกต่าง และอาร์เอ็มเอส , ผลการวัดตัวบ่งชี้ “ความเร็วและการประสานงานของการกระทำ” ตามผลการวอร์มอัพ, กำหนดไว้ในตาราง 4.3 (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.30 ของตัวอย่าง 2.14 ในหน้า 16 ของการพัฒนาวิธีการนี้)
3. ทีมงานแต่ละคน วัด (ทดสอบ) ความเร็ว (ส่วนตัว) ของคุณและการประสานงานของการกระทำหลังจากการวอร์มอัพ
5. ทำการคำนวณโดยเฉลี่ย ความแตกต่าง และอาร์เอ็มเอส ,ผลการวัดตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" หลังจากการอุ่นเครื่อง กำหนดไว้ในตาราง 4.4 เขียนผลการวัดโดยรวมตามผลการอุ่นเครื่อง (ดูการคำนวณที่คล้ายกันที่ให้ไว้ทันทีหลังจากตาราง 2.31 ของตัวอย่าง 2.14 ในหน้า 17 ของการพัฒนาวิธีการนี้)
6. ทำการคำนวณและข้อสรุปที่จำเป็นทั้งหมดคล้ายกับการคำนวณและข้อสรุปของตัวอย่างที่ 2.14 ที่ให้ไว้ในส่วนที่ 2 ของการพัฒนาวิธีการนี้ในหน้า 16-17 ควรคำนึงถึงเมื่อคำนวณข้อผิดพลาดในการเป็นตัวแทน "ม" จำเป็นต้องใช้สูตร 2.1 ที่ให้ไว้ในหน้า 12 ของการพัฒนาวิธีการนี้เนื่องจากตัวอย่างคือ n และจำนวนองค์ประกอบในประชากร N ( ไม่ทราบ
IV – ขั้นตอนการวิจัย
การประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์
ประเมินความสม่ำเสมอ (ความเสถียร) ของตัวบ่งชี้ "ความเร็วและการประสานงานของการกระทำ" ของสมาชิกในทีมสองคนโดยใช้เกณฑ์ฟิชเชอร์ตามผลการวัดที่ได้รับในขั้นตอนที่สามของการวิจัยในงานห้องปฏิบัติการนี้
ในการทำเช่นนี้คุณต้องทำสิ่งต่อไปนี้
การใช้ข้อมูลจากตาราง 4.3 และ 4.4 ผลลัพธ์ของการคำนวณความแปรปรวนจากตารางเหล่านี้ที่ได้รับในขั้นตอนที่สามของการวิจัยตลอดจนวิธีการคำนวณและการใช้เกณฑ์ฟิชเชอร์เพื่อประเมินความสม่ำเสมอ (ความมั่นคง) ของตัวบ่งชี้กีฬาที่ให้ไว้ใน ตัวอย่าง 2.15 ในหน้า 18-19 ของการพัฒนาวิธีการนี้ ให้สรุปผลทางสถิติและการสอนที่เหมาะสม
V – ขั้นตอนการวิจัย
การประเมินกลุ่มตัวบ่งชี้ “ความรวดเร็วและการประสานงานของการกระทำ” ของสมาชิกในทีมหนึ่งคนก่อนและหลังการวอร์มอัพ
คุณสมบัติที่ต้องชำระเงินคุณลักษณะนัยสำคัญทางสถิติมีเฉพาะบางส่วนเท่านั้น แผนภาษี- ตรวจสอบว่าอยู่ใน.
คุณสามารถดูได้ว่าคำตอบที่ได้รับมีความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่ กลุ่มที่แตกต่างกันผู้ตอบแบบสอบถาม หากต้องการใช้คุณลักษณะนัยสำคัญทางสถิติใน SurveyMonkey คุณต้อง:
- เปิดใช้งานคุณลักษณะนัยสำคัญทางสถิติเมื่อเพิ่มกฎการเปรียบเทียบให้กับคำถามในแบบสำรวจของคุณ เลือกกลุ่มผู้ตอบแบบสอบถามเพื่อเปรียบเทียบเพื่อจัดเรียงผลการสำรวจเป็นกลุ่มเพื่อเปรียบเทียบด้วยภาพ
- ตรวจสอบตารางที่มีข้อมูลเกี่ยวกับคำถามในแบบสำรวจของคุณเพื่อระบุการมีอยู่ของข้อมูลทางสถิติ ความแตกต่างที่สำคัญในคำตอบที่ได้รับจากผู้ตอบแบบสอบถามกลุ่มต่างๆ
ดูนัยสำคัญทางสถิติ
โดยทำตามขั้นตอนด้านล่าง คุณจะสามารถสร้างแบบสำรวจที่แสดงนัยสำคัญทางสถิติได้
1. เพิ่มคำถามปลายปิดในแบบสำรวจของคุณ
เพื่อแสดงนัยสำคัญทางสถิติเมื่อวิเคราะห์ผลลัพธ์ คุณจะต้องใช้กฎการเปรียบเทียบกับคำถามใดๆ ในแบบสำรวจของคุณ
คุณสามารถใช้กฎการเปรียบเทียบและคำนวณนัยสำคัญทางสถิติในการตอบสนอง หากคุณใช้ข้อใดข้อหนึ่งต่อไปนี้ในการออกแบบแบบสำรวจของคุณ: ประเภทต่อไปนี้คำถาม:
จำเป็นต้องตรวจสอบให้แน่ใจว่าตัวเลือกคำตอบที่เสนอสามารถแบ่งออกเป็นกลุ่มได้ครบถ้วน ตัวเลือกการตอบสนองที่คุณเลือกสำหรับการเปรียบเทียบเมื่อคุณสร้างกฎการเปรียบเทียบจะถูกใช้เพื่อจัดระเบียบข้อมูลลงในครอสแท็บตลอดทั้งแบบสำรวจ
2. รวบรวมคำตอบ
เมื่อคุณทำแบบสำรวจเสร็จแล้ว ให้สร้างผู้รวบรวมเพื่อส่งออก มีหลายวิธี
คุณต้องได้รับการตอบกลับอย่างน้อย 30 รายการสำหรับแต่ละตัวเลือกการตอบกลับที่คุณวางแผนจะใช้ในกฎการเปรียบเทียบเพื่อเปิดใช้งานและดูนัยสำคัญทางสถิติ
ตัวอย่างการสำรวจ
คุณต้องการค้นหาว่าผู้ชายพอใจกับผลิตภัณฑ์ของคุณมากกว่าผู้หญิงอย่างมีนัยสำคัญหรือไม่
- เพิ่มคำถามแบบเลือกตอบสองข้อในแบบสำรวจของคุณ:
เพศของคุณคืออะไร? (ชาย, หญิง)
คุณพอใจหรือไม่พอใจกับผลิตภัณฑ์ของเรา? (พอใจ, ไม่พอใจ) - ตรวจสอบให้แน่ใจว่าผู้ตอบแบบสอบถามอย่างน้อย 30 คนเลือก "ชาย" สำหรับคำถามเรื่องเพศ และผู้ตอบแบบสอบถามอย่างน้อย 30 คนเลือก "หญิง" เป็นเพศ
- เพิ่มกฎการเปรียบเทียบให้กับคำถาม "คุณเพศอะไร" และเลือกทั้งสองตัวเลือกเป็นกลุ่มของคุณ
- ใช้ตารางข้อมูลด้านล่างแผนภูมิคำถาม "คุณพอใจหรือไม่พอใจกับผลิตภัณฑ์ของเรา" เพื่อดูว่าตัวเลือกการตอบสนองใดๆ แสดงความแตกต่างที่มีนัยสำคัญทางสถิติหรือไม่
ความแตกต่างที่มีนัยสำคัญทางสถิติคืออะไร?
ความแตกต่างที่มีนัยสำคัญทางสถิติหมายความว่าการวิเคราะห์ทางสถิติได้กำหนดว่ามีความแตกต่างที่มีนัยสำคัญระหว่างคำตอบของผู้ตอบแบบสอบถามกลุ่มหนึ่งและคำตอบของอีกกลุ่มหนึ่ง นัยสำคัญทางสถิติหมายความว่าตัวเลขที่ได้รับแตกต่างกันอย่างมีนัยสำคัญ ความรู้ดังกล่าวจะช่วยคุณในการวิเคราะห์ข้อมูลได้อย่างมาก อย่างไรก็ตาม คุณเป็นผู้กำหนดความสำคัญของผลลัพธ์ที่ได้รับ คุณเป็นผู้ตัดสินใจว่าจะตีความผลการสำรวจอย่างไร และควรดำเนินการอย่างไรโดยพิจารณาจากผลลัพธ์เหล่านั้น
ตัวอย่างเช่น คุณได้รับการร้องเรียนจากลูกค้าผู้หญิงมากกว่าลูกค้าผู้ชาย เราจะทราบได้อย่างไรว่าความแตกต่างดังกล่าวมีจริงหรือไม่ และจำเป็นต้องดำเนินการอย่างไร วิธีหนึ่งที่ดีในการทดสอบข้อสังเกตของคุณคือทำแบบสำรวจที่จะแสดงให้คุณเห็นว่าลูกค้าผู้ชายพอใจกับผลิตภัณฑ์ของคุณมากกว่าอย่างเห็นได้ชัดหรือไม่ เมื่อใช้สูตรทางสถิติ ฟังก์ชันนัยสำคัญทางสถิติของเราจะทำให้คุณสามารถระบุได้ว่าจริงๆ แล้วผลิตภัณฑ์ของคุณดึงดูดใจผู้ชายมากกว่าผู้หญิงหรือไม่ ซึ่งจะทำให้คุณสามารถดำเนินการตามข้อเท็จจริงมากกว่าการคาดเดา
ความแตกต่างที่มีนัยสำคัญทางสถิติ
หากผลลัพธ์ของคุณถูกเน้นไว้ในตารางข้อมูล แสดงว่าผู้ตอบแบบสอบถามทั้งสองกลุ่มมีความแตกต่างกันอย่างมาก คำว่า “นัยสำคัญ” ไม่ได้หมายความว่าตัวเลขผลลัพธ์มีความสำคัญหรือนัยสำคัญใดๆ เฉพาะเจาะจง เพียงแต่ว่ามีความแตกต่างทางสถิติระหว่างตัวเลขเหล่านั้นเท่านั้น
ไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติ
หากผลลัพธ์ของคุณไม่ได้ถูกเน้นในตารางข้อมูลที่เกี่ยวข้อง นั่นหมายความว่าแม้ว่าตัวเลขทั้งสองที่นำมาเปรียบเทียบอาจมีความแตกต่างกัน แต่ก็ไม่มีความแตกต่างทางสถิติระหว่างตัวเลขเหล่านั้น
การตอบสนองที่ไม่มีความแตกต่างที่มีนัยสำคัญทางสถิติแสดงให้เห็นว่าไม่มีความแตกต่างที่มีนัยสำคัญระหว่างสองรายการที่ถูกเปรียบเทียบเมื่อพิจารณาจากขนาดตัวอย่างที่คุณใช้ แต่ไม่ได้หมายความว่ารายการเหล่านั้นไม่มีนัยสำคัญเสมอไป บางทีด้วยการเพิ่มขนาดตัวอย่าง คุณจะสามารถระบุความแตกต่างที่มีนัยสำคัญทางสถิติได้
ขนาดตัวอย่าง
หากคุณมีขนาดตัวอย่างน้อยมากเท่านั้น ความแตกต่างที่ยิ่งใหญ่ระหว่างสองกลุ่ม หากคุณมีขนาดตัวอย่างที่ใหญ่มาก ความแตกต่างทั้งเล็กและใหญ่จะถูกนับว่ามีนัยสำคัญ
อย่างไรก็ตาม การที่ตัวเลขสองตัวมีความแตกต่างกันทางสถิติไม่ได้หมายความว่าความแตกต่างระหว่างผลลัพธ์จะสร้างความแตกต่างให้กับคุณแต่อย่างใด ความสำคัญในทางปฏิบัติ- คุณจะต้องตัดสินใจด้วยตัวเองว่าความแตกต่างใดที่มีความหมายต่อแบบสำรวจของคุณ
การคำนวณนัยสำคัญทางสถิติ
เราคำนวณนัยสำคัญทางสถิติโดยใช้ระดับความเชื่อมั่น 95% มาตรฐาน ถ้าตัวเลือกคำตอบแสดงเป็นนัยสำคัญทางสถิติ หมายความว่าโดยบังเอิญเพียงอย่างเดียวหรือเนื่องจากข้อผิดพลาดในการสุ่มตัวอย่าง มีความน่าจะเป็นน้อยกว่า 5% ของความแตกต่างระหว่างสองกลุ่มที่เกิดขึ้น (มักแสดงเป็น: p<0,05).
ในการคำนวณความแตกต่างที่มีนัยสำคัญทางสถิติระหว่างกลุ่ม เราใช้สูตรต่อไปนี้:
พารามิเตอร์ |
คำอธิบาย | |
---|---|---|
ก1 | เปอร์เซ็นต์ของผู้เข้าร่วมจากกลุ่มแรกที่ตอบคำถามด้วยวิธีใดวิธีหนึ่ง คูณด้วยขนาดกลุ่มตัวอย่างของกลุ่มนี้ | |
ข1 | เปอร์เซ็นต์ของผู้เข้าร่วมจากกลุ่มที่สองที่ตอบคำถามด้วยวิธีใดวิธีหนึ่ง คูณด้วยขนาดกลุ่มตัวอย่างของกลุ่มนี้ | |
สัดส่วนตัวอย่างรวม (p) | การรวมกันของสองหุ้นจากทั้งสองกลุ่ม | |
ข้อผิดพลาดมาตรฐาน (SE) | ตัวบ่งชี้ว่าหุ้นของคุณแตกต่างจากหุ้นจริงมากน้อยเพียงใด ค่าที่ต่ำกว่าหมายถึงเศษส่วนนั้นใกล้เคียงกับเศษส่วนจริง ค่าที่สูงกว่าหมายความว่าเศษส่วนนั้นแตกต่างจากเศษส่วนจริงอย่างมาก | |
สถิติการทดสอบ (t) | สถิติการทดสอบ จำนวนค่าเบี่ยงเบนมาตรฐานซึ่งค่าที่กำหนดแตกต่างจากค่าเฉลี่ย | |
นัยสำคัญทางสถิติ | หากค่าสัมบูรณ์ของสถิติการทดสอบมากกว่า 1.96* ส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย จะถือว่ามีความแตกต่างที่มีนัยสำคัญทางสถิติ |
*1.96 คือค่าที่ใช้สำหรับระดับความเชื่อมั่น 95% เนื่องจาก 95% ของช่วงที่ฟังก์ชันการแจกแจงแบบ t ของนักเรียนจัดการอยู่ภายในค่าเบี่ยงเบนมาตรฐาน 1.96 ของค่าเฉลี่ย
ตัวอย่างการคำนวณ
จากตัวอย่างที่ใช้ข้างต้น มาดูกันว่าเปอร์เซ็นต์ของผู้ชายที่กล่าวว่าตนพอใจกับผลิตภัณฑ์ของคุณนั้นสูงกว่าเปอร์เซ็นต์ของผู้หญิงอย่างมีนัยสำคัญหรือไม่
สมมติว่าผู้ชาย 1,000 คนและผู้หญิง 1,000 คนมีส่วนร่วมในการสำรวจของคุณ และผลการสำรวจพบว่าผู้ชาย 70% และผู้หญิง 65% กล่าวว่าพวกเขาพอใจกับผลิตภัณฑ์ของคุณ ระดับ 70% สูงกว่าระดับ 65% อย่างมีนัยสำคัญหรือไม่
แทนที่ข้อมูลต่อไปนี้จากแบบสำรวจลงในสูตรที่กำหนด:
- p1 (% ของผู้ชายพอใจกับผลิตภัณฑ์) = 0.7
- p2 (% ของผู้หญิงที่พอใจกับผลิตภัณฑ์) = 0.65
- n1 (จำนวนผู้ชายที่สำรวจ) = 1,000
- n2 (จำนวนผู้หญิงที่สัมภาษณ์) = 1,000
เนื่องจากค่าสัมบูรณ์ของสถิติการทดสอบมากกว่า 1.96 หมายความว่าความแตกต่างระหว่างชายและหญิงมีนัยสำคัญ เมื่อเทียบกับผู้หญิง ผู้ชายมีแนวโน้มที่จะพอใจกับผลิตภัณฑ์ของคุณมากกว่า
ซ่อนนัยสำคัญทางสถิติ
วิธีซ่อนนัยสำคัญทางสถิติสำหรับทุกคำถาม
- คลิกลูกศรลงทางด้านขวาของกฎการเปรียบเทียบในแถบด้านข้างซ้าย
- เลือกรายการ แก้ไขกฎ.
- ปิดการใช้งานคุณสมบัติ แสดงนัยสำคัญทางสถิติโดยใช้สวิตช์
- คลิกปุ่ม นำมาใช้.
หากต้องการซ่อนนัยสำคัญทางสถิติสำหรับคำถามเดียว คุณต้อง:
- คลิกปุ่ม ปรับแต่งเหนือแผนภาพของปัญหานี้
- เปิดแท็บ ตัวเลือกการแสดงผล.
- ยกเลิกการเลือกช่องถัดจาก นัยสำคัญทางสถิติ.
- คลิกปุ่ม บันทึก.
ตัวเลือกการแสดงผลจะเปิดใช้งานโดยอัตโนมัติเมื่อเปิดใช้งานการแสดงนัยสำคัญทางสถิติ หากคุณล้างตัวเลือกการแสดงผลนี้ การแสดงนัยสำคัญทางสถิติจะถูกปิดใช้งานด้วย
เปิดคุณลักษณะนัยสำคัญทางสถิติเมื่อเพิ่มกฎการเปรียบเทียบให้กับคำถามในแบบสำรวจของคุณ ตรวจสอบตารางข้อมูลสำหรับคำถามในแบบสำรวจของคุณเพื่อดูว่าคำตอบที่ได้รับจากกลุ่มผู้ตอบแบบสอบถามแต่ละกลุ่มมีความแตกต่างกันอย่างมีนัยสำคัญทางสถิติหรือไม่