เรียนรู้
ปัญหาการเปรียบเทียบหลายตัวแปรคืออะไร | สถิติ
ปัญหาการเปรียบเทียบหลายครั้งเป็นปัญหาที่เกิดขึ้นเมื่อดำเนินการทดสอบหลายครั้งบนตัวอย่างเดียวกัน ตัวอย่างจะอธิบายสิ่งนี้
เช่น
สมมติว่ามีการศึกษาวิจัยที่พิจารณาปัจจัยเสี่ยงที่อาจทำให้เกิดอาการบาดเจ็บจากการวิ่งในนักวิ่งมือใหม่จำนวน 5,000 คน มีการทดสอบตัวแปรต่างๆ เนื่องจากเรายังไม่ทราบว่าตัวแปรใดจะเพิ่มความเสี่ยง ตัวอย่าง ได้แก่: ปริมาณการวิ่ง การลดระดับของกระดูกส้นเท้า มุม Q ความแข็งแรงของกล้ามเนื้อต้นขาด้านหน้าและกล้ามเนื้อก้น รูปแบบการลงน้ำหนักที่ส้นเท้าเทียบกับปลายเท้า รองเท้าแบบมินิมอลเทียบกับแบบแม็กซิมอล และการยืดเหยียดข้อเท้า
ผลบวกเท็จจากการเปรียบเทียบหลายครั้ง
นักวิจัยส่วนใหญ่จะยอมรับอัตราผลบวกปลอม 5% ซึ่ง เป็นระดับอัลฟ่าหรือระดับนัยสำคัญ นี่สำหรับตัวแปรที่กำหนดไว้ เช่น ความแข็งแรงของกล้ามเนื้อต้นขาด้านหน้า หมายความว่าถ้าทำการศึกษานี้ซ้ำ 100 ครั้ง จะมีการศึกษา 5 ครั้งที่แสดง ผลลัพธ์บวกปลอม แต่ในความเป็นจริงแล้วไม่มีผลลัพธ์บวกปลอมเลย
อย่างไรก็ตาม นักวิจัยกำลังพิจารณาตัวแปรสิบตัว ไม่ใช่แค่ความแข็งแรงของสี่เท่าเท่านั้น ภายในตัวอย่างเดียวกัน เรื่องนี้ก่อให้เกิดปัญหา
นักวิจัยไม่ทราบปัญหานี้จึงทำการทดลอง สองปีต่อมาข้อมูลก็ออกมาแสดงให้เห็นว่ารูปแบบการลงส้นเท้าและความแข็งแรงของกล้ามเนื้อก้นเป็นปัจจัยเสี่ยงต่อการบาดเจ็บจากการวิ่ง ยอดเยี่ยม! นั่นคือบทสรุปและเอกสารก็ได้รับการตีพิมพ์
ตามที่ระบุไว้ก่อนหน้านี้ ระดับนัยสำคัญที่ 5% ไม่ได้หมายความว่ามีอัตราผลบวกปลอม 5% ณ จุดนี้ เนื่องจากมีตัวแปรต่างๆ มากมายที่กำลังได้รับการวิจัย ดังนั้นนักวิจัยจึงยอมรับความเสี่ยงที่จะเกิดผลลัพธ์บวกปลอมได้มากขึ้นโดยทำการทดลองโดยดูที่ตัวแปร 10 ตัว
อัตราข้อผิดพลาดตามครอบครัวแสดงให้เห็นสิ่งนี้ ด้วยการคำนวณง่ายๆ เราก็สามารถตรวจสอบอัตราผลบวกปลอมได้ ซึ่งอยู่ที่ 40%! สูตรแสดงไว้ด้านล่างนี้
แนวทางแก้ไขปัญหาการเปรียบเทียบหลาย ๆ ครั้ง
ฉันคิดว่าเราคงเห็นด้วยกันว่าเรื่องนี้เป็นปัญหา แล้วเราจะทำอย่างไรดีล่ะ? ก็มีทางแก้ครับ. นักวิจัยสามารถทำการแก้ไขเพื่อต่อต้านภาวะเงินเฟ้ออัลฟ่าได้โดยการแก้ไขแบบ Bonferroni หรือ Holm เรื่องนี้จะกล่าวถึงใน “ การควบคุมอัตราข้อผิดพลาดประเภทที่ 1 ”
สูตรอัตราข้อผิดพลาดแยกตามครอบครัว:
1 – (1 – ɑ)x
ɑ: ระดับอัลฟ่าหรือความสำคัญในทศนิยม
x: จำนวนการทดสอบ
ข้อผิดพลาดประเภทที่ 2
อย่างไรก็ตาม การปรับระดับนัยสำคัญของการทดสอบแต่ละรายการอาจเพิ่มความน่าจะเป็นที่จะเกิด ข้อผิดพลาดประเภท II (ผลลบเท็จ) ในการทดสอบทั้งหมดได้ เนื่องจากระดับนัยสำคัญที่เข้มงวดยิ่งขึ้นจะลดอำนาจของการทดสอบแต่ละรายการในการตรวจจับผลหรือความสัมพันธ์ที่แท้จริง ดังนั้นอาจพลาดผลที่สำคัญในการทดสอบบางอย่าง ส่งผลให้เกิด ผลลบปลอม เพื่อหลีกเลี่ยงผลลัพธ์ลบเท็จอันเนื่องมาจากปัญหาการเปรียบเทียบหลายครั้ง เราสามารถใช้เทคนิคต่างๆ เช่น การลงทะเบียนสมมติฐานล่วงหน้า การศึกษาการจำลอง หรือวิธีทางสถิติที่มีประสิทธิภาพมากขึ้น เช่น การอนุมานแบบเบย์เซียน นอกจากนี้ สิ่งสำคัญคือการออกแบบการศึกษาและสมมติฐานที่ต้องทดสอบอย่างรอบคอบเพื่อลดจำนวนการทดสอบที่ดำเนินการให้เหลือน้อยที่สุด และเพื่อให้แน่ใจว่าการทดสอบเหล่านั้นมีความหมายและเกี่ยวข้องกับคำถามวิจัย
ชอบสิ่งที่คุณเรียนรู้หรือไม่?
ซื้อ หนังสือประเมิน Physiotutors ฉบับเต็ม
- หนังสืออีบุ๊กมากกว่า 600 หน้า
- เนื้อหาเชิงโต้ตอบ (การสาธิตวิดีโอโดยตรง บทความ PubMed)
- ค่าสถิติสำหรับการทดสอบพิเศษทั้งหมดจากการวิจัยล่าสุด
- มีจำหน่ายใน 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- และอื่นๆอีกมากมาย!