เรียนรู้
ค่า P คืออะไร | สถิติ
หากพูดแบบง่ายๆ ค่า p แสดงถึงความประหลาดใจที่คุณมีกับข้อมูล โดยถือว่าไม่มีผลกระทบใดๆ ยิ่งค่า p ต่ำลง ข้อมูลก็ยิ่งดูเหมือนจะไม่เข้ากันได้กับโมเดลของคุณมากขึ้น (นั่นคือ สันนิษฐานว่าไม่มีผลกระทบใดๆ)
เช่น
เมื่อเปรียบเทียบการรักษา A กับการรักษา B คุณถือว่าไม่มีผลใดๆ หรือไม่มีความแตกต่าง คุณคาดหวังว่าสมมติฐานว่างจะถูกต้อง คุณทำการทดสอบแล้วได้ค่า p เท่ากับ 0.02 นั่นหมายความว่าข้อมูลที่คุณรวบรวมมาค่อนข้างน่าแปลกใจ เมื่อพิจารณาว่าคุณถือว่ากลุ่มต่างๆ จะไม่แตกต่างกัน
ค่า p มีไว้เพื่อป้องกันตัวเองจากความสุ่ม หากคุณทำการศึกษา มีโอกาสสูงที่ผลลัพธ์ที่คุณเห็นจะเป็นเพียงแบบสุ่ม หรือที่เราเรียกกันว่าเป็นสัญญาณรบกวนข้อมูล นั่นเป็นเหตุผลที่คุณอาจเห็นความแตกต่างที่เห็นได้ชัดในค่าเฉลี่ยระหว่างกลุ่ม แต่ไม่มีผลที่สำคัญทางสถิติ มันสามารถไปทางอื่นได้เช่นกัน การศึกษาอาจแสดงผลลัพธ์ที่ไม่สำคัญ แต่ก็อาจมีผลกระทบที่แท้จริงได้ บางทีอาจเป็นเพราะขนาดตัวอย่างมีขนาดเล็กเกินไป
อะไรบ้างที่มีอิทธิพลต่อค่า p?
ค่า P ได้รับอิทธิพลจากปัจจัยต่างๆ หลายประการ ได้แก่ ขนาดตัวอย่าง ขนาดผลกระทบ และประเภทของการทดสอบพร้อมสมมติฐาน
- ขนาดตัวอย่าง: ยิ่งกลุ่มมีขนาดใหญ่เท่าใด คุณก็จะได้รับผลลัพธ์ที่มีนัยสำคัญทางสถิติได้เร็วขึ้นโดยมีความแตกต่างเพียงเล็กน้อย และในทางกลับกัน
- ขนาดผลกระทบ : ยิ่งขนาดผลกระทบมีขนาดใหญ่เท่าใด คุณก็จะได้รับผลลัพธ์ที่มีนัยสำคัญทางสถิติได้เร็วขึ้น แม้กระทั่งกับกลุ่มที่เล็กกว่า และในทางกลับกัน
- ประเภทของการทดสอบ: การทดสอบจะมีความละเอียดอ่อนมากขึ้นต่อความแตกต่างที่มีสมมติฐานบางประการ เช่น การกระจายข้อมูล ความเป็นอิสระของการวัด ความแปรปรวนเท่ากัน ด้านเดียวเทียบกับสองด้าน ระหว่างกลุ่มเทียบกับภายในกลุ่ม เป็นต้น
เช่น.
การศึกษาวิจัยขนาดใหญ่สามารถค้นพบผลลัพธ์ที่มีนัยสำคัญทางสถิติได้แม้ว่าจะมีผลกระทบเพียงเล็กน้อยก็ตาม ผลกระทบเหล่านี้อาจไม่มีความหมายอะไร นี่คือจุดที่ความสำคัญทางคลินิกเข้ามามีบทบาท การศึกษาเพนิซิลลินเดิมใช้ตัวอย่างขนาดเล็กเพื่อให้ข้อมูลแสดงให้เห็นว่ามีผลกระทบมหาศาลต่อการกำจัดแบคทีเรีย
ค่าพี < เกณฑ์ 0.05
เกณฑ์ความสำคัญทางสถิติที่นักวิจัยส่วนใหญ่ใช้ (เช่น p < 0.05) เป็นเพียงค่าที่ไม่แน่นอน เมื่อพิจารณาถึงปัจจัยทั้งหมดแล้ว ควรเปลี่ยนแปลงตามการตั้งค่าการศึกษาของคุณ หากคุณไม่ต้องการ ผลลัพธ์บวกปลอม จริงๆ (เช่น ตัดสินใจเข้ารับการผ่าตัดที่คุกคามชีวิต) คุณจะต้องมีค่าเกณฑ์ที่ต่ำ หากคุณไม่ต้องการผลลบเทียมจริงๆ (เช่น การวินิจฉัยเนื้องอกร้ายแรง) คุณจะต้องใช้ การศึกษาวิจัยที่มีกำลังขยาย สูง จากนั้นจึงกำหนดค่าเกณฑ์ค่า p ที่สูงขึ้น ภาพนี้แสดงให้เห็นความสัมพันธ์แบบให้และรับระหว่างข้อผิดพลาด ประเภท 1 (α) และข้อผิดพลาด ประเภท 2 (ß)
โปรดทราบว่าค่า p ได้มาจากข้อมูล ไม่ใช่จากทฤษฎี คุณไม่สามารถ "พิสูจน์" ทฤษฎีของคุณด้วยผลที่มีนัยสำคัญทางสถิติได้ สิ่งเดียวที่คุณทำได้คือพยายามหักล้างทฤษฎีของคุณด้วยการศึกษาวิจัยอื่นๆ หากมันเป็นจริง ทฤษฎีของคุณก็ยังคงยืนหยัดอยู่ นี่คือการปลอมแปลง
ความเข้าใจผิดเกี่ยวกับค่า p
ความเข้าใจผิดที่พบบ่อยเกี่ยวกับค่า p ในการวิจัยทางการแพทย์ ได้แก่:
- ค่า p ที่มีนัยสำคัญหมายความว่าผลกระทบหรือความสัมพันธ์นั้นมีมากหรือมีความสำคัญทางคลินิก
- ความเป็นจริง : ค่า p ระบุเพียงความน่าจะเป็นในการได้รับผลลัพธ์ที่สังเกตได้หรือผลลัพธ์ที่รุนแรงกว่าภายใต้ สมมติฐานว่าง ไม่ได้ให้ข้อมูลเกี่ยวกับ ขนาดหรือความสำคัญทางคลินิกของผล หรือความสัมพันธ์
- ค่า p ที่ไม่สำคัญหมายความว่าไม่มีผลหรือความสัมพันธ์ใดๆ
- ความเป็นจริง : ค่า p ที่ไม่สำคัญเพียงแต่แสดงว่าผลลัพธ์ที่สังเกตได้ไม่มีนัยสำคัญทางสถิติ แต่ไม่ได้หมายความว่าไม่มีผลหรือความสัมพันธ์ใดๆ เกิดขึ้น อาจเกิดจาก กำลังทางสถิติ ที่ต่ำหรือปัจจัยอื่นๆ เช่น ข้อผิดพลาดในการวัดหรือตัวแปรที่ทำให้สับสน
- ค่า p ที่ 0.05 เป็นเกณฑ์สากลสำหรับความสำคัญทางสถิติ
- ความเป็นจริง : การเลือกระดับความสำคัญขึ้นอยู่กับบริบท และควรขึ้นอยู่กับปัจจัยต่างๆ เช่น การออกแบบการศึกษา ขนาดตัวอย่าง และผลที่ตามมาจากการเกิด ข้อผิดพลาดประเภท I ระดับนัยสำคัญ ที่ต่ำกว่าอาจเหมาะสมในบางสถานการณ์ เช่น ในการศึกษาวิจัยที่มี การเปรียบเทียบหลายรายการ หรือมีความเสี่ยงสูง
- ค่า p ที่มีนัยสำคัญพิสูจน์ถึงสาเหตุ
- ความเป็นจริง : ความสำคัญทางสถิติบ่งชี้ถึงความน่าจะเป็นในการได้รับผลลัพธ์ที่สังเกตได้หรือผลลัพธ์ที่รุนแรงกว่าภายใต้สมมติฐานว่างเท่านั้น มันไม่ได้สร้างความสัมพันธ์เชิงเหตุผล ซึ่งต้องมีหลักฐานเพิ่มเติมจากการออกแบบการศึกษา ความน่าเชื่อถือทางชีววิทยา และปัจจัยอื่นๆ
- ขนาดตัวอย่างที่ใหญ่จะทำให้มีค่า p ที่สำคัญเสมอ
- ความเป็นจริง : ขนาดตัวอย่างขนาดใหญ่เพิ่มพลังในการตรวจจับผลหรือความสัมพันธ์ แต่ไม่ได้รับประกันค่า p ที่มีนัยสำคัญ ขนาดผลกระทบ ความแปรปรวน และปัจจัยอื่นๆ ยังมีบทบาทในการกำหนดความสำคัญทางสถิติด้วย
อ้างอิง
เอลกินส์, นาย, ปินโต, RZ, เวอร์ฮาเกน, เอ., กรีโกโรวิคซ์, เอ็ม., โซเดอร์ลันด์, เอ., เกมันน์, เอ็ม., โกเมซ-โคเนซา, เอ., แบลนตัน, เอส., บริสมี, เจเอ็ม, อัการ์วาล, เอส., เจตต์ , A. , Karstens, S. , Harms, M. , Verheyden, G. , & Sheikh, U. (2022). การอนุมานทางสถิติผ่านการประมาณ: คำแนะนำจากบรรณาธิการวารสารสมาคมกายภาพบำบัดนานาชาติ วารสารการบำบัดด้วยมือและการจัดการ 30(3), 133–138
Neyman, J. และ Pearson, ES (พ.ศ. 2471) เรื่องการใช้และการตีความเกณฑ์การทดสอบบางประการเพื่อวัตถุประสงค์ในการอนุมานทางสถิติ ไบโอเมตริกซ์, 20A, 175-240.
ชอบสิ่งที่คุณเรียนรู้หรือไม่?
ซื้อ หนังสือประเมิน Physiotutors ฉบับเต็ม
- หนังสืออีบุ๊กมากกว่า 600 หน้า
- เนื้อหาเชิงโต้ตอบ (การสาธิตวิดีโอโดยตรง บทความ PubMed)
- ค่าสถิติสำหรับการทดสอบพิเศษทั้งหมดจากการวิจัยล่าสุด
- มีจำหน่ายใน 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- และอื่นๆอีกมากมาย!