Научете
Какво е P-стойност? | Статистика
На прост език p-стойността изразява колко изненадани сте от данните, ако приемем, че няма ефект. Колкото по-ниска е р-стойността, толкова по-несъвместими изглеждат данните с вашия модел (т.е. предположението, че няма ефект).
Напр.
Сравнявате лечение А с лечение Б, предполагате, че няма ефект или разлика; очаквате нулевата хипотеза да е вярна. Извършвате теста и получавате p-стойност 0,02. Това означава, че събраните от вас данни са доста изненадващи, като се има предвид, че сте предполагали, че групите няма да се различават.
Стойността p съществува, за да се предпазите от случайността. Ако провеждате проучване, има вероятност ефектите, които виждате, да са просто случайни - или както го наричаме - шум в данните. Ето защо може да видите забележими разлики в средните стойности между групите, но без статистически значим ефект. Може да се случи и обратното. Дадено проучване може да покаже незначителен резултат, но да има истински ефект; може би защото размерът на извадката е твърде малък.
Какво влияе на р-стойността?
Р-стойностите се влияят от няколко различни фактора: размер на извадката, размер на ефекта и вида на теста и неговите предположения.
- Големина на извадката: колкото по-голяма е групата, толкова по-бързо ще получите статистически значими резултати при малки разлики - и обратното.
- Размер на ефекта: колкото по-голям е размерът на ефекта, толкова по-бързо ще получите статистически значими резултати, дори при по-малки групи - и обратно.
- Вид на теста: тестът става по-чувствителен към разликите при определени допускания, например за разпределението на данните, независимостта на мерките, хомоскедастичността, едностранното срещу двустранното, между групите срещу вътрешногруповото и т.н.
Напр.
Едно огромно проучване може да открие статистически значими резултати дори при най-малките ефекти. Тези ефекти може да не означават нищо. Тук се появява клиничната значимост.В оригиналното проучване на пеницилина е използвана малка проба, за да се покаже, че данните имат огромно въздействие върху елиминирането на бактериите.
Р-стойност <0,05 праг
Прагът за статистическа значимост, който използват повечето изследователи (т.е. p < 0,05), е произволен. При всички положения тя трябва да се промени в зависимост от настройката на изследването. Ако наистина не искате да получите фалшиви положителни резултати (например решение за извършване на животозастрашаваща операция), ви е необходимо ниско прагово число. Ако наистина не искате фалшиво отрицателни резултати (например при диагностициране на агресивни тумори), ви е необходимо мощнопроучване с впоследствие по-високо прагово число на р-стойността. Това илюстрира връзката между грешките от тип 1 (α) и тип 2 (ß ).
Обърнете внимание, че р-стойността се получава от данните, а не от теорията. Не можете да "докажете" теорията си със статистически значим ефект. Единственото нещо, което можете да направите, е да се опитате да опровергаете теорията си с различни изследвания, ако тя е валидна, теорията ви остава в сила. Това е фалшификация.
Погрешни схващания за p-стойността
Някои често срещани погрешни схващания за p-стойността в медицинските изследвания включват:
- Значима р-стойност означава, че ефектът или връзката са големи или клинично значими.
- Реалност: Стойността p показва само вероятността да се получи наблюдаваният резултат или по-краен резултат при нулевата хипотеза. Той не предоставя информация за размера или клиничната значимост на ефекта или връзката
- Незначителна p-стойност означава, че няма ефект или връзка.
- Реалност: Незначителната р-стойност само подсказва, че наблюдаваният резултат не е статистически значим, но не означава непременно, че няма ефект или връзка. Това може да се дължи на ниска статистическа мощ или на други фактори, като например грешка при измерването или смущаващи променливи.
- Стойност p от 0,05 е универсален праг за статистическа значимост.
- Реалност: Изборът на ниво на значимост зависи от контекста и трябва да се основава на фактори като плана на изследването, размера на извадката и последиците от допускането на грешка от тип I. По-ниско ниво на значимост може да е подходящо в някои ситуации, като например при проучвания с многобройни сравнения или с високи залози.
- Значителната p-стойност доказва причинно-следствената връзка.
- Реалност: Статистическата значимост показва само вероятността да се получи наблюдаваният резултат или по-краен резултат при нулевата хипотеза. Той не доказва причинно-следствената връзка, за която са необходими допълнителни доказателства, свързани с дизайна на изследването, биологичната достоверност и други фактори.
- Големият размер на извадката винаги води до значителна р-стойност.
- Реалност: Големият размер на извадката увеличава силата за откриване на ефект или връзка, но не гарантира значителна р-стойност. Размерът на ефекта, променливостта и други фактори също играят роля при определянето на статистическата значимост.
Препратки
Elkins, M. R., Pinto, R. Z., Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, J. M., Agarwal, S., Jette, A., Karstens, S., Harms, M., Verheyden, G., & Sheikh, U. (2022). Статистически изводи чрез оценяване: препоръки на Международното дружество на редакторите на списания по физиотерапия. The Journal of manual & manipulative therapy, 30(3), 133-138.
Нейман, Дж. и Пиърсън, Е.С. (1928) За използването и тълкуването на някои тестови критерии за целите на статистическите изводи. Biometrika, 20A, 175-240.
Харесва ли ви това, което учите?
ЗАКУПЕТЕ ПЪЛНАТА КНИГА ЗА ОЦЕНКА НА ФИЗИОТЕРАПЕВТИ
- 600+ страници електронна книга
- Интерактивно съдържание (директна видео демонстрация, статии в PubMed)
- Статистически стойности за всички специални тестове от най-новите изследвания
- Предлага се в 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- И още много други неща!