Уики Статистики и методология

Какво е P-стойност? | Статистика

Проверете нашия магазин
Какво е P-стойност?
Намерете това уики в платформата Physiotutors Станете член

Научете

Какво е P-стойност? | Статистика

На прост език p-стойността изразява колко изненадани сте от данните, ако приемем, че няма ефект. Колкото по-ниска е р-стойността, толкова по-несъвместими изглеждат данните с вашия модел (т.е. предположението, че няма ефект).

Напр.

Сравнявате лечение А с лечение Б, предполагате, че няма ефект или разлика; очаквате нулевата хипотеза да е вярна. Извършвате теста и получавате p-стойност 0,02. Това означава, че събраните от вас данни са доста изненадващи, като се има предвид, че сте предполагали, че групите няма да се различават.

Стойността p съществува, за да се предпазите от случайността. Ако провеждате проучване, има вероятност ефектите, които виждате, да са просто случайни - или както го наричаме - шум в данните. Ето защо може да видите забележими разлики в средните стойности между групите, но без статистически значим ефект. Може да се случи и обратното. Дадено проучване може да покаже незначителен резултат, но да има истински ефект; може би защото размерът на извадката е твърде малък.

 

Какво влияе на р-стойността?

Р-стойностите се влияят от няколко различни фактора: размер на извадката, размер на ефекта и вида на теста и неговите предположения.

  • Големина на извадката: колкото по-голяма е групата, толкова по-бързо ще получите статистически значими резултати при малки разлики - и обратното.
  • Размер на ефекта: колкото по-голям е размерът на ефекта, толкова по-бързо ще получите статистически значими резултати, дори при по-малки групи - и обратно.
  • Вид на теста: тестът става по-чувствителен към разликите при определени допускания, например за разпределението на данните, независимостта на мерките, хомоскедастичността, едностранното срещу двустранното, между групите срещу вътрешногруповото и т.н.

Напр. 

Едно огромно проучване може да открие статистически значими резултати дори при най-малките ефекти. Тези ефекти може да не означават нищо. Тук се появява клиничната значимост.В оригиналното проучване на пеницилина е използвана малка проба, за да се покаже, че данните имат огромно въздействие върху елиминирането на бактериите.

 

Р-стойност <0,05 праг

Прагът за статистическа значимост, който използват повечето изследователи (т.е. p < 0,05), е произволен. При всички положения тя трябва да се промени в зависимост от настройката на изследването. Ако наистина не искате да получите фалшиви положителни резултати (например решение за извършване на животозастрашаваща операция), ви е необходимо ниско прагово число. Ако наистина не искате фалшиво отрицателни резултати (например при диагностициране на агресивни тумори), ви е необходимо мощнопроучване с впоследствие по-високо прагово число на р-стойността. Това илюстрира връзката между грешките от тип 1 (α) и тип 2 (ß ).

Обърнете внимание, че р-стойността се получава от данните, а не от теорията. Не можете да "докажете" теорията си със статистически значим ефект. Единственото нещо, което можете да направите, е да се опитате да опровергаете теорията си с различни изследвания, ако тя е валидна, теорията ви остава в сила. Това е фалшификация.

Погрешни схващания за p-стойността

Някои често срещани погрешни схващания за p-стойността в медицинските изследвания включват:

  • Значима р-стойност означава, че ефектът или връзката са големи или клинично значими.
  • Незначителна p-стойност означава, че няма ефект или връзка.
    • Реалност: Незначителната р-стойност само подсказва, че наблюдаваният резултат не е статистически значим, но не означава непременно, че няма ефект или връзка. Това може да се дължи на ниска статистическа мощ или на други фактори, като например грешка при измерването или смущаващи променливи.
  • Стойност p от 0,05 е универсален праг за статистическа значимост.
    • Реалност: Изборът на ниво на значимост зависи от контекста и трябва да се основава на фактори като плана на изследването, размера на извадката и последиците от допускането на грешка от тип I. По-ниско ниво на значимост може да е подходящо в някои ситуации, като например при проучвания с многобройни сравнения или с високи залози.
  • Значителната p-стойност доказва причинно-следствената връзка.
    • Реалност: Статистическата значимост показва само вероятността да се получи наблюдаваният резултат или по-краен резултат при нулевата хипотеза. Той не доказва причинно-следствената връзка, за която са необходими допълнителни доказателства, свързани с дизайна на изследването, биологичната достоверност и други фактори.
  • Големият размер на извадката винаги води до значителна р-стойност.
    • Реалност: Големият размер на извадката увеличава силата за откриване на ефект или връзка, но не гарантира значителна р-стойност. Размерът на ефекта, променливостта и други фактори също играят роля при определянето на статистическата значимост.

Препратки

Elkins, M. R., Pinto, R. Z., Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, J. M., Agarwal, S., Jette, A., Karstens, S., Harms, M., Verheyden, G., & Sheikh, U. (2022). Статистически изводи чрез оценяване: препоръки на Международното дружество на редакторите на списания по физиотерапия. The Journal of manual & manipulative therapy, 30(3), 133-138.
Нейман, Дж. и Пиърсън, Е.С. (1928) За използването и тълкуването на някои тестови критерии за целите на статистическите изводи. Biometrika, 20A, 175-240.

Greenland, S., Senn, S. J., Rothman, K. J., Carlin, J. B., Poole, C., Goodman, S. N., & Altman, D. G. (2016). Статистически тестове, стойности на Р, доверителни интервали и мощност: ръководство за погрешни интерпретации. European journal of epidemiology, 31(4), 337-350.

Кампер С. Й. (2019). Тълкуване на резултатите 2-Статистическа значимост и клинична значимост: Свързване на доказателствата с практиката. Списание за ортопедична и спортна физиотерапия, 49(7), 559-560. 

Карл Попър, "Допускания и опровержения", Лондон: Routledge and Keagan Paul, 1963 г., стр. 33-39; от Theodore Schick, ed., Readings in the Philosophy of Science, Mountain View, CA: Mayfield Publishing Company, 2000 г., стр. 9-13

Christley, R.M. (2010). Власт и грешка: Повишен риск от фалшиво положителни резултати при недостатъчно силни проучвания. The Open Epidemiology Journal, 3, 16-19.

Fleming A. За антибактериалното действие на култури от пеницилий, със специално внимание към използването им за изолиране на B. influenzæ. Br J Exp Pathol. 1929 Jun;10(3):226-36. PMCID: PMC2048009.

Ериксон, Р. А. и Ратнър, Б. А. (2020). Отвъд p < 0,05 в екотоксикологията: Ръководство за практикуващи. Токсикология и химия на околната среда, 39(9), 1657-1669.

Харесва ли ви това, което учите?

ЗАКУПЕТЕ ПЪЛНАТА КНИГА ЗА ОЦЕНКА НА ФИЗИОТЕРАПЕВТИ

  • 600+ страници електронна книга
  • Интерактивно съдържание (директна видео демонстрация, статии в PubMed)
  • Статистически стойности за всички специални тестове от най-новите изследвания
  • Предлага се в 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
  • И още много други неща!
Big print bock 5.2

КАКВО КАЗВАТ КЛИЕНТИТЕ ЗА ЕЛЕКТРОННАТА КНИГА ЗА ОЦЕНКА

Изтеглете безплатното приложение Physiotutors сега!

Група 3546
Изтегляне на изображения на мобилен телефон
Макет на мобилно приложение
Лого на приложението
Макет на приложение
Разгледайте нашата книга "Всичко в едно"!
Изтеглете нашето БЕЗПЛАТНО приложение