ما هي قيمة P-Value؟ | الإحصائيات

انتقل إلى

ابحث عن هذا الويكي على منصة فيزيوتورز كن عضواً

تعلّم

ما هي قيمة P-Value؟ | الإحصائيات

بعبارات بسيطة تعبر القيمة p عن مدى دهشتك من البيانات، بافتراض عدم وجود تأثير. كلما انخفضت قيمة p، كلما بدت البيانات غير متوافقة مع نموذجك (أي افتراض عدم وجود تأثير).

على سبيل المثال.

تتم مقارنة العلاج (أ) بالعلاج (ب)، وتفترض عدم وجود تأثير أو عدم وجود فرق، وتتوقع أن تكون الفرضية الفارغة صحيحة. قمت بإجراء الاختبار وحصلت على قيمة p تساوي 0.02. وهذا يعني أن البيانات التي جمعتها مثيرة للدهشة إلى حد كبير، بالنظر إلى أنك افترضت أن المجموعات لن تختلف.

القيمة p موجودة لحماية نفسك من العشوائية. إذا قمت بإجراء دراسة، فمن المحتمل أن تكون التأثيرات التي تراها مجرد ضوضاء عشوائية - أو ضوضاء البيانات، كما نسميها. لهذا السبب قد ترى اختلافات ملحوظة في القيم المتوسطة بين المجموعات، ولكن لا يوجد تأثير ذو دلالة إحصائية. ويمكن أن يحدث العكس أيضاً. قد تُظهر دراسة ما نتيجة غير مهمة، ولكن قد يكون هناك تأثير حقيقي؛ ربما لأن حجم العينة صغير جدًا.

ما الذي يؤثر على قيمة p؟

تتأثر قيم P-قيم P بعدة عوامل مختلفة: حجم العينة، وحجم التأثير، ونوع الاختبار بافتراضاته.

حجم العينة: كلما كان حجم العينة أكبر، كلما حصلت على نتائج ذات دلالة إحصائية أسرع مع وجود اختلافات صغيرة - والعكس صحيح.
حجم التأثير: كلما كان حجم التأثير أكبر، كلما حصلت على نتائج ذات دلالة إحصائية أسرع، حتى مع المجموعات الأصغر - والعكس صحيح
نوع الاختبار: يصبح الاختبار أكثر حساسية للاختلافات مع افتراضات معينة حول توزيع البيانات على سبيل المثال، واستقلالية المقاييس، والتجانس في المقاييس، والتماثل في المقاييس، وأحادية الجانب مقابل ثنائية الجانب، وبين المجموعة مقابل داخل المجموعة، إلخ.

على سبيل المثال.

يمكن أن تتوصل دراسة ضخمة إلى نتائج ذات دلالة إحصائية ذات تأثيرات ضئيلة. قد لا تعني هذه التأثيرات شيئاً. وهنا يأتي دور الأهمية السريرية، حيث استخدمت دراسة البنسلين الأصلية عينة صغيرة جدًا لتظهر البيانات أن هناك تأثيرات هائلة في القضاء على البكتيريا.

قيمة P-قيمة P <0.05 الحد الأدنى

إن عتبة الدلالة الإحصائية التي يستخدمها معظم الباحثين (أي p < 0.05) هي مجرد اعتباطية. كل الأمور يجب أن تتغير بناءً على إعدادات دراستك. إذا كنت لا تريد حقًا نتائج إيجابية كاذبة (على سبيل المثال قرار الخضوع لعملية جراحية تهدد الحياة)، فأنت بحاجة إلى رقم عتبة منخفض. إذا كنت لا تريد حقًا الحصول على نتائج سلبية كاذبة (على سبيل المثال تشخيص الأورام العدوانية)، فأنت بحاجة إلىدراسة عالية القوة مع رقم عتبة قيمة p-قيمة p أعلى لاحقًا. يوضح هذا علاقة الأخذ والعطاء بين أخطاء النوع 1 (α) والنوع 2 (ß).

لاحظ أن القيمة p مستمدة من البيانات وليس من النظرية. لا يمكنك "إثبات" نظريتك بتأثير ذي دلالة إحصائية. الشيء الوحيد الذي يمكنك القيام به هو محاولة دحض نظريتك بدراسات مختلفة، فإذا كانت صحيحة فإن نظريتك قائمة. هذا هو التزوير.

المفاهيم الخاطئة حول القيمة p

تتضمن بعض المفاهيم الخاطئة الشائعة حول القيمة p في الأبحاث الطبية ما يلي:

تعني قيمة p ذات دلالة إحصائية كبيرة أن التأثير أو الارتباط كبير أو ذو مغزى سريريًا.
- الواقع: تشير قيمة p فقط إلى احتمالية الحصول على النتيجة المرصودة أو أكثر تطرفًا في ظل الفرضية الفارغة. لا يوفر معلومات حول الحجم أو الأهمية السريرية للتأثير أو الارتباط
تعني قيمة p غير ذات دلالة إحصائية عدم وجود تأثير أو ارتباط.
- الواقع: تشير قيمة p غير ذات دلالة إحصائية فقط إلى أن النتيجة المرصودة ليست ذات دلالة إحصائية، ولكنها لا تعني بالضرورة عدم وجود تأثير أو ارتباط. قد يكون ذلك بسبب انخفاض القوة الإحصائية أو عوامل أخرى مثل خطأ القياس أو المتغيرات المربكة.
تُعد قيمة p 0.05 عتبة عالمية للدلالة الإحصائية.
- الواقع: يعتمد اختيار مستوى الدلالة على السياق ويجب أن يعتمد على عوامل مثل تصميم الدراسة وحجم العينة وعواقب ارتكاب خطأ من النوع الأول. قد يكون مستوى الدلالة المنخفض مناسبًا في بعض الحالات، كما هو الحال في الدراسات ذات المقارنات المتعددة أو ذات المخاطر العالية
تُثبت قيمة p-قيمة معنوية كبيرة وجود علاقة سببية.
- الواقع: تشير الدلالة الإحصائية فقط إلى احتمالية الحصول على النتيجة المرصودة أو أكثر تطرفًا في ظل الفرضية الفارغة. لا يثبت السببية التي تتطلب أدلة إضافية من تصميم الدراسة والمعقولية البيولوجية وعوامل أخرى.
دائمًا ما يؤدي حجم العينة الكبير إلى قيمة p-قيمة كبيرة.
- الواقع: يزيد حجم العينة الكبير من القدرة على اكتشاف التأثير أو الارتباط، لكنه لا يضمن الحصول على قيمة p-قيمة p كبيرة. يلعب حجم التأثير والتباين وعوامل أخرى أيضًا دورًا في تحديد الدلالة الإحصائية.

المراجع

Elkins, M. R., Pinto, R. Z., Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, J. M., Agarwal, S., Jette, A., Karstens, S., Harms, M., Verheyden, G., & Sheikh, U. (2022). الاستدلال الإحصائي من خلال التقدير: توصيات من الجمعية الدولية لمحرري مجلات العلاج الطبيعي. مجلة العلاج اليدوي والتلاعب، 30(3)، 133-138.
نيمان، ج. وبيرسون، إ. س. (1928) حول استخدام وتفسير بعض معايير الاختبار لأغراض الاستدلال الإحصائي. بيومتريكا، 20 أ، 175-240.

Greenland, S., S., S. S. J., Rothman, K. J., Carlin, J. B., Poole, C., Goodman, S. N., & Altman, D. G. (2016). الاختبارات الإحصائية، وقيم P، وفترات الثقة، والقوة: دليل للتفسيرات الخاطئة. المجلة الأوروبية لعلم الأوبئة، 31(4)، 337-350.

كامبر س. ج. (2019). تفسير النتائج 2-الأهمية الإحصائية والمغزى السريري: ربط الأدلة بالممارسة. مجلة جراحة العظام والعلاج الطبيعي الرياضي، 49(7)، 559-560.

كارل بوبر، تخمينات وتفنيدات، لندن: روتليدج وكيغان بول، 1963، ص 33-39؛ من ثيودور شيك، محررة، قراءات في فلسفة العلم، ماونتن فيو، كاليفورنيا: شركة مايفيلد للنشر، 2000، ص 9-13

كريستلي، ر.م. (2010). القوة والخطأ: زيادة خطر ظهور نتائج إيجابية كاذبة في الدراسات ضعيفة القوة. مجلة علم الأوبئة المفتوحة، 3، 16-19.

فليمينج أ. عن العمل المضاد للبكتيريا لمزارع البنسليوم، مع إشارة خاصة إلى استخدامها في عزل بكتيريا ب. إنفلونزا. Br J J Exp Pathol. 1929 يونيو؛ 10(3):226-36. PMCID: PMC2048009

إريكسون، ر. أ. وراتنر، ب. أ. (2020). تجاوز p < 0.05 في علم السموم البيئية: دليل للممارسين. علم السموم البيئية والكيمياء، 39(9)، 1657-1669.

هل أعجبك ما تتعلمه؟

اشتر كتاب التقييم الكامل للفيزيائيين

كتاب إلكتروني من أكثر من 600 صفحة
المحتوى التفاعلي (عرض توضيحي مباشر بالفيديو، مقالات المجلات الطبية)
القيم الإحصائية لجميع الاختبارات الخاصة من أحدث الأبحاث
متوفر في 🇬🇧 🇩🇪 🇩🇪 🇫🇷 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
وأكثر من ذلك بكثير!

تحقق من متجرنا

ما يقوله العملاء عن الكتاب الإلكتروني للتقييم

فينس1992

25/04/20

كتاب التقييم الإلكتروني ساعدني هذا الكتاب في دراستي للامتحان وفي تقييم مرضاي الأوائل. رائع! للمبتدئين أيضاً!

سيمون باجيتز

06/04/20

كتاب التقييم الإلكتروني إنه تجميع رائع! تهانينا لكل العمل الذي قمت به هناك. من المحتمل أنك ستجد جميع الاختبارات التي كنت تبحث عنها مع شرح ومصدر محترف للتحقق بنفسك. بالتأكيد يجب أن يكون لكل طالب، ولكنه سيساعد أيضًا الممارسين ذوي الخبرة. أتطلع إلى التحديثات التي ستستمر مدى الحياة حول المواضيع.
عمل رائع يا رفاق
جوردي بوروت

27/10/19

كتاب التقييم الإلكتروني كتاب ضروري لجميع أخصائيي العلاج الطبيعي وأخصائيي تقويم العظام والمعالجين اليدويين. أجرى المؤلفان بحثًا موسعًا حول اختبارات التقييم في العلاج اليدوي. أجدها سهلة القراءة للغاية. كلما قرأت أكثر كلما تعلمت أكثر. شكراً لك!

جوش

07/07/19

كتاب التقييم الإلكتروني هذا الكتاب رائع! إنه منظم للغاية ومفصل. يعمل بشكل جيد للغاية على جهاز Macbook و iPad.
بولو_سوا

15/02/19

كتاب التقييم الإلكتروني أفضل طريقة لإنفاق 80 يورو. يستحق ذلك تماماً. لا بد أن حجم العمل الذي بذلته وراء ذلك كان ضخماً للغاية. يجب أن يمتلكها كل أخصائي علاج طبيعي أو فيزيائي.
تهانينا يا رفاق لقد قمتم بعمل رائع.
لقد تعلمت الكثير من الأشياء الجديدة وتغيرت طريقتي في العلاج بشكل عام تمامًا.
بكلمة واحدة: مذهل. استمروا يا رفاق! أطيب التمنيات من فرنسا