เรียนรู้
ระดับอัลฟ่าคืออะไร? | สถิติ
ในสถิติแบบความถี่ ระดับอัลฟ่า (เรียกอีกอย่างว่าระดับนัยสำคัญ) คือความน่าจะเป็นในการปฏิเสธ สมมติฐานว่าง เมื่อเป็นจริง ในบริบทของการวิจัยกายภาพบำบัด สมมติฐานว่างอาจเป็นว่าไม่มีความแตกต่างกันในการลดความเจ็บปวดระหว่างการแทรกแซงทางกายภาพบำบัดสองแบบที่แตกต่างกัน โดยทั่วไประดับอัลฟาจะถูกกำหนดไว้ที่ 0.05 ซึ่งหมายความว่ามีโอกาส 5% ที่จะปฏิเสธ สมมติฐานว่าง อย่างไม่ถูกต้อง (นั่นคือ สรุปได้ว่าความแตกต่างในการลดลงของความเจ็บปวดในขณะที่จริง ๆ แล้วไม่มีอยู่) ในระยะยาว
สิ่งสำคัญอย่างยิ่งคือต้องพิจารณาสิ่งนี้เป็นผลลัพธ์ในระยะยาว หากทำการศึกษาลักษณะเดียวกันจำนวน 100 ครั้ง โดยเฉลี่ยแล้ว 5 ครั้งจะแสดง ผลลัพธ์บวกปลอม หากไม่มีผลกระทบใดๆ
อธิบายด้วยตัวอย่าง
ลองนึกภาพว่ามีการศึกษาเปรียบเทียบการแทรกแซงทางกายภาพบำบัด 2 วิธีสำหรับอาการปวดหลังส่วนล่าง และผลลัพธ์แสดงให้เห็นว่าค่าเฉลี่ยการลดลงของอาการปวดสำหรับการแทรกแซง A คือ 6 คะแนนบนมาตราส่วนความเจ็บปวด และค่าเฉลี่ยการลดลงของอาการปวดสำหรับการแทรกแซง B คือ 8 คะแนนบนมาตราส่วนความเจ็บปวด โดยมี ระดับอัลฟา ที่ 0.05 นักวิจัยจะปฏิเสธสมมติฐานว่างและสรุปว่ามีข้อแตกต่างที่สำคัญทางสถิติในการลดความเจ็บปวดระหว่างการแทรกแซงทั้งสองแบบ เนื่องจากความแตกต่างของค่าเฉลี่ยมีมากกว่าสิ่งที่คาดหวังโดยบังเอิญ
ทุกคนยกย่อง p<0.05?
สิ่งสำคัญคือต้องทราบว่าการตั้ง ค่าระดับอัลฟ่า เป็น 0.05 เป็นเพียงแบบแผนและไม่ใช่กฎเกณฑ์ การเลือกระดับอัลฟ่าขึ้นอยู่กับบริบทของการศึกษาและผลที่อาจเกิดขึ้นจากผล บวกปลอม หรือผล ลบปลอม ตัวอย่างเช่น หากผลที่ตามมาจากผลบวกปลอม (เช่น สรุปว่าการรักษาได้ผลทั้งที่ไม่ได้ผล) รุนแรงมากขึ้น นักวิจัยอาจเลือกใช้ระดับอัลฟ่าที่ต่ำกว่า (เช่น 0.01) เพื่อลดความน่าจะเป็นของผลบวกปลอม
มุมมองระยะยาว
เราต้องการเน้นย้ำอีกครั้งถึงความสำคัญของการมองในระยะยาว คุณไม่สามารถพูดได้ง่ายๆ ว่ามีโอกาส 5% ว่าเอกสารจะกลายเป็นผลลัพธ์บวกปลอมได้ เมื่อมีการดำเนินการวิจัย มันเป็นเพียงผลบวกปลอม หรือไม่ก็ไม่ใช่ 5% หมายถึงผลลัพธ์ในระยะยาว การทำการทดสอบนี้ในหลาย ๆ การศึกษาที่มีเงื่อนไขที่คล้ายคลึงกันจะทำให้มีเอกสารประมาณ 5% ที่ให้ผลลัพธ์ บวกปลอม
การแทรกแซงทางกายภาพบำบัดอาจดูมีประสิทธิผลมากในการลดอาการปวดหลังส่วนล่าง โดยมี ค่า p เพียงเล็กน้อย (แสดงถึงความแตกต่างที่มีนัยสำคัญทางสถิติ) และ ขนาดผล ที่ใหญ่ อย่างไรก็ตาม หากไม่นำการศึกษาวิจัยนี้ไปจำลองในการศึกษาวิจัยอื่นๆ ก็จะยากที่จะระบุได้ว่าผลลัพธ์ดังกล่าวเป็นผลจากโอกาสหรือจากผลกระทบที่แท้จริง
มุมมองระยะยาวจะพิจารณาผลลัพธ์ของการศึกษาหลายชิ้นในช่วงเวลาหนึ่งเพื่อให้เข้าใจประสิทธิภาพของการแทรกแซงได้อย่างครอบคลุมมากขึ้น แนวทางนี้มีความสำคัญอย่างยิ่งในการวิจัยกายภาพบำบัด ซึ่งผลลัพธ์จากการศึกษาเพียงครั้งเดียวอาจไม่สามารถนำไปใช้กับประชากรหรือสภาพแวดล้อมอื่นๆ ได้
ความเข้าใจผิด
มีความเข้าใจผิดทั่วไปหลายประการเกี่ยวกับค่า p:
- ค่า p เป็นตัววัดความแข็งแกร่งของหลักฐาน : ค่า p ไม่ ได้วัดความแข็งแกร่งของหลักฐานที่ขัดแย้งกับสมมติฐานว่าง แต่เป็นความน่าจะเป็นในการสังเกตสถิติทดสอบว่าสุดขั้วหรือสุดโต่งกว่าค่าที่สังเกตได้ โดยถือว่าสมมติฐานว่างเป็นจริง
- ค่า p ที่น้อยแสดงว่ามีหลักฐานที่ชัดเจนว่าขัดแย้งกับสมมติฐานว่าง ค่า p ที่น้อยบ่งชี้เพียงว่าข้อมูลไม่สอดคล้องกับสมมติฐานว่าง แต่ ไม่ ได้ให้หลักฐานสำหรับสมมติฐานทางเลือก นอกจากนี้ค่า p ที่น้อยไม่ได้หมายความว่าผลกระทบนั้นจะใหญ่หรือสำคัญ
- ค่า p ที่ 0.05 เป็นเกณฑ์สำคัญในการประเมินความสำคัญ : เกณฑ์ 0.05 ถือเป็นค่าที่ไม่แน่นอนและได้ถูกนำมาใช้เป็นเกณฑ์ตัดสินความสำคัญทางสถิติโดยทั่วไป แต่ ไม่ ได้หมายความว่าผลลัพธ์ที่มีค่า p มากกว่า 0.05 จะไม่มีความสำคัญโดยอัตโนมัติ การตีความค่า p ควรขึ้นอยู่กับบริบทและคำถามการวิจัยที่กำลังศึกษาอยู่
- ค่า p คือความน่าจะเป็นที่สมมติฐานว่างจะเป็นจริง : ค่า p ไม่ใช่ความน่าจะเป็นที่สมมติฐานว่างจะเป็นจริง แต่เป็นความน่าจะเป็นในการสังเกตข้อมูลถ้าสมมติฐานว่างเป็นจริง
- ค่า p สามารถนำมาใช้ในการอนุมานเชิงสาเหตุได้ : ค่า p จะให้หลักฐานสำหรับหรือต่อต้านสมมติฐานว่างเท่านั้น และไม่จำเป็นต้องบ่งชี้ถึงความสัมพันธ์เชิงเหตุผล การอนุมานเชิงสาเหตุต้องมีข้อมูลเพิ่มเติม เช่น การศึกษาวิจัยที่มีการออกแบบที่ดีพร้อมการควบคุมที่เหมาะสมสำหรับปัจจัยที่ทำให้เกิดความสับสน
สำหรับข้อมูลเพิ่มเติมเกี่ยวกับค่า P ลองดูโพสต์ของเราเกี่ยวกับเรื่องนี้ ที่นี่ !
อ้างอิง
ชอบสิ่งที่คุณเรียนรู้หรือไม่?
ซื้อ หนังสือประเมิน Physiotutors ฉบับเต็ม
- หนังสืออีบุ๊กมากกว่า 600 หน้า
- เนื้อหาเชิงโต้ตอบ (การสาธิตวิดีโอโดยตรง บทความ PubMed)
- ค่าสถิติสำหรับการทดสอบพิเศษทั้งหมดจากการวิจัยล่าสุด
- มีจำหน่ายใน 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- และอื่นๆอีกมากมาย!