สถิติและวิธีการ ของวิกิ

ระดับอัลฟ่าคืออะไร? | สถิติ

เช็คร้านค้าของเรา
ระดับอัลฟ่าคืออะไร?

เรียนรู้

ระดับอัลฟ่าคืออะไร? | สถิติ

ในสถิติแบบความถี่ ระดับอัลฟ่า (เรียกอีกอย่างว่าระดับนัยสำคัญ) คือความน่าจะเป็นในการปฏิเสธ สมมติฐานว่าง เมื่อเป็นจริง ในบริบทของการวิจัยกายภาพบำบัด สมมติฐานว่างอาจเป็นว่าไม่มีความแตกต่างกันในการลดความเจ็บปวดระหว่างการแทรกแซงทางกายภาพบำบัดสองแบบที่แตกต่างกัน โดยทั่วไประดับอัลฟาจะถูกกำหนดไว้ที่ 0.05 ซึ่งหมายความว่ามีโอกาส 5% ที่จะปฏิเสธ สมมติฐานว่าง อย่างไม่ถูกต้อง (นั่นคือ สรุปได้ว่าความแตกต่างในการลดลงของความเจ็บปวดในขณะที่จริง ๆ แล้วไม่มีอยู่) ในระยะยาว

สิ่งสำคัญอย่างยิ่งคือต้องพิจารณาสิ่งนี้เป็นผลลัพธ์ในระยะยาว หากทำการศึกษาลักษณะเดียวกันจำนวน 100 ครั้ง โดยเฉลี่ยแล้ว 5 ครั้งจะแสดง ผลลัพธ์บวกปลอม หากไม่มีผลกระทบใดๆ

อธิบายด้วยตัวอย่าง

ลองนึกภาพว่ามีการศึกษาเปรียบเทียบการแทรกแซงทางกายภาพบำบัด 2 วิธีสำหรับอาการปวดหลังส่วนล่าง และผลลัพธ์แสดงให้เห็นว่าค่าเฉลี่ยการลดลงของอาการปวดสำหรับการแทรกแซง A คือ 6 คะแนนบนมาตราส่วนความเจ็บปวด และค่าเฉลี่ยการลดลงของอาการปวดสำหรับการแทรกแซง B คือ 8 คะแนนบนมาตราส่วนความเจ็บปวด โดยมี ระดับอัลฟา ที่ 0.05 นักวิจัยจะปฏิเสธสมมติฐานว่างและสรุปว่ามีข้อแตกต่างที่สำคัญทางสถิติในการลดความเจ็บปวดระหว่างการแทรกแซงทั้งสองแบบ เนื่องจากความแตกต่างของค่าเฉลี่ยมีมากกว่าสิ่งที่คาดหวังโดยบังเอิญ

ทุกคนยกย่อง p<0.05?

สิ่งสำคัญคือต้องทราบว่าการตั้ง ค่าระดับอัลฟ่า เป็น 0.05 เป็นเพียงแบบแผนและไม่ใช่กฎเกณฑ์ การเลือกระดับอัลฟ่าขึ้นอยู่กับบริบทของการศึกษาและผลที่อาจเกิดขึ้นจากผล บวกปลอม หรือผล ลบปลอม ตัวอย่างเช่น หากผลที่ตามมาจากผลบวกปลอม (เช่น สรุปว่าการรักษาได้ผลทั้งที่ไม่ได้ผล) รุนแรงมากขึ้น นักวิจัยอาจเลือกใช้ระดับอัลฟ่าที่ต่ำกว่า (เช่น 0.01) เพื่อลดความน่าจะเป็นของผลบวกปลอม

มุมมองระยะยาว

เราต้องการเน้นย้ำอีกครั้งถึงความสำคัญของการมองในระยะยาว คุณไม่สามารถพูดได้ง่ายๆ ว่ามีโอกาส 5% ว่าเอกสารจะกลายเป็นผลลัพธ์บวกปลอมได้ เมื่อมีการดำเนินการวิจัย มันเป็นเพียงผลบวกปลอม หรือไม่ก็ไม่ใช่ 5% หมายถึงผลลัพธ์ในระยะยาว การทำการทดสอบนี้ในหลาย ๆ การศึกษาที่มีเงื่อนไขที่คล้ายคลึงกันจะทำให้มีเอกสารประมาณ 5% ที่ให้ผลลัพธ์ บวกปลอม

การแทรกแซงทางกายภาพบำบัดอาจดูมีประสิทธิผลมากในการลดอาการปวดหลังส่วนล่าง โดยมี ค่า p เพียงเล็กน้อย (แสดงถึงความแตกต่างที่มีนัยสำคัญทางสถิติ) และ ขนาดผล ที่ใหญ่ อย่างไรก็ตาม หากไม่นำการศึกษาวิจัยนี้ไปจำลองในการศึกษาวิจัยอื่นๆ ก็จะยากที่จะระบุได้ว่าผลลัพธ์ดังกล่าวเป็นผลจากโอกาสหรือจากผลกระทบที่แท้จริง

มุมมองระยะยาวจะพิจารณาผลลัพธ์ของการศึกษาหลายชิ้นในช่วงเวลาหนึ่งเพื่อให้เข้าใจประสิทธิภาพของการแทรกแซงได้อย่างครอบคลุมมากขึ้น แนวทางนี้มีความสำคัญอย่างยิ่งในการวิจัยกายภาพบำบัด ซึ่งผลลัพธ์จากการศึกษาเพียงครั้งเดียวอาจไม่สามารถนำไปใช้กับประชากรหรือสภาพแวดล้อมอื่นๆ ได้

ความเข้าใจผิด

มีความเข้าใจผิดทั่วไปหลายประการเกี่ยวกับค่า p:

  • ค่า p เป็นตัววัดความแข็งแกร่งของหลักฐาน : ค่า p ไม่ ได้วัดความแข็งแกร่งของหลักฐานที่ขัดแย้งกับสมมติฐานว่าง แต่เป็นความน่าจะเป็นในการสังเกตสถิติทดสอบว่าสุดขั้วหรือสุดโต่งกว่าค่าที่สังเกตได้ โดยถือว่าสมมติฐานว่างเป็นจริง
  • ค่า p ที่น้อยแสดงว่ามีหลักฐานที่ชัดเจนว่าขัดแย้งกับสมมติฐานว่าง ค่า p ที่น้อยบ่งชี้เพียงว่าข้อมูลไม่สอดคล้องกับสมมติฐานว่าง แต่ ไม่ ได้ให้หลักฐานสำหรับสมมติฐานทางเลือก นอกจากนี้ค่า p ที่น้อยไม่ได้หมายความว่าผลกระทบนั้นจะใหญ่หรือสำคัญ
  • ค่า p ที่ 0.05 เป็นเกณฑ์สำคัญในการประเมินความสำคัญ : เกณฑ์ 0.05 ถือเป็นค่าที่ไม่แน่นอนและได้ถูกนำมาใช้เป็นเกณฑ์ตัดสินความสำคัญทางสถิติโดยทั่วไป แต่ ไม่ ได้หมายความว่าผลลัพธ์ที่มีค่า p มากกว่า 0.05 จะไม่มีความสำคัญโดยอัตโนมัติ การตีความค่า p ควรขึ้นอยู่กับบริบทและคำถามการวิจัยที่กำลังศึกษาอยู่
  • ค่า p คือความน่าจะเป็นที่สมมติฐานว่างจะเป็นจริง : ค่า p ไม่ใช่ความน่าจะเป็นที่สมมติฐานว่างจะเป็นจริง แต่เป็นความน่าจะเป็นในการสังเกตข้อมูลถ้าสมมติฐานว่างเป็นจริง
  • ค่า p สามารถนำมาใช้ในการอนุมานเชิงสาเหตุได้ : ค่า p จะให้หลักฐานสำหรับหรือต่อต้านสมมติฐานว่างเท่านั้น และไม่จำเป็นต้องบ่งชี้ถึงความสัมพันธ์เชิงเหตุผล การอนุมานเชิงสาเหตุต้องมีข้อมูลเพิ่มเติม เช่น การศึกษาวิจัยที่มีการออกแบบที่ดีพร้อมการควบคุมที่เหมาะสมสำหรับปัจจัยที่ทำให้เกิดความสับสน

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับค่า P ลองดูโพสต์ของเราเกี่ยวกับเรื่องนี้ ที่นี่ !

 

อ้างอิง

อัปเชอร์, อาร์. อี. (2544). จริยธรรมของอัลฟ่า: บทสะท้อนเกี่ยวกับสถิติ หลักฐาน และคุณค่าในทางการแพทย์ การแพทย์ทฤษฎีและชีวจริยธรรม 22(6), 565-576

เบอร์เกอร์, วี.ดับเบิลยู. และ เชียห์, จี. (2548). การคิดใหม่เกี่ยวกับสถิติ: การใช้ข้อมูลด้านความปลอดภัยในการประเมินระดับอัลฟาของประสิทธิผลในรูปแบบการทดลองแบบสุ่ม วารสารการแพทย์ฉุกเฉินของอิสราเอล, 5(3), 55-60.

Neyman, J. และ Pearson, E.S. (พ.ศ. 2471) เรื่องการใช้และการตีความเกณฑ์การทดสอบบางประการเพื่อวัตถุประสงค์ในการอนุมานทางสถิติ ไบโอเมตริกซ์, 20A, 175-240.

กรีนแลนด์, เอส. เซนน์, เอส. เจ., รอธแมน, เค. เจ., คาร์ลิน, เจ. บี., พูล, ซี., กูดแมน, เอส. เอ็น., และอัลท์แมน, ดี. จี. (2559). การทดสอบทางสถิติ ค่า P ช่วงความเชื่อมั่น และกำลัง: คำแนะนำสำหรับการตีความผิด วารสารระบาดวิทยายุโรป 31(4), 337–350

ชอบสิ่งที่คุณเรียนรู้หรือไม่?

ซื้อ หนังสือประเมิน Physiotutors ฉบับเต็ม

  • หนังสืออีบุ๊กมากกว่า 600 หน้า
  • เนื้อหาเชิงโต้ตอบ (การสาธิตวิดีโอโดยตรง บทความ PubMed)
  • ค่าสถิติสำหรับการทดสอบพิเศษทั้งหมดจากการวิจัยล่าสุด
  • มีจำหน่ายใน 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
  • และอื่นๆอีกมากมาย!
บ็อกพิมพ์ใหญ่ 5.2

สิ่งที่ลูกค้าพูดเกี่ยวกับหนังสือประเมินผลแบบอิเล็กทรอนิกส์

ดาวน์โหลด แอป Physiotutors ฟรีทันที!

กลุ่ม 3546
ดาวน์โหลดภาพมือถือ
แอพโมบายจำลอง
โลโก้แอป
โมเดลแอพ
ลองดูหนังสือ All in One ของเราสิ!
ดาวน์โหลดแอปของเราฟรี