Naučte se
Co je to hodnota P? | Statistiky
Zjednodušeně řečeno p-hodnota vyjadřuje, jak moc vás data překvapila za předpokladu, že neexistuje žádný vliv. Čím nižší je p-hodnota, tím více se zdá, že data neodpovídají vašemu modelu (tj. předpokladu, že neexistuje žádný účinek).
Např.
Porovnáváte léčbu A s léčbou B, předpokládáte, že neexistuje žádný účinek nebo rozdíl; očekáváte, že nulová hypotéza je správná. Provedete test a získáte p-hodnotu 0,02. To znamená, že údaje, které jste shromáždili, jsou docela překvapivé, vzhledem k tomu, že jste předpokládali, že se skupiny nebudou lišit.
Hodnota p existuje proto, abyste se chránili před náhodou. Pokud provedete studii, je pravděpodobné, že pozorované efekty jsou pouze náhodné - nebo, jak říkáme, šum v datech. Proto můžete vidět znatelné rozdíly v průměrných hodnotách mezi skupinami, ale žádný statisticky významný efekt. Může to být i naopak. Studie může ukázat nesignifikantní výsledek, ale může se jednat o skutečný účinek; třeba proto, že vzorek je příliš malý.
Co ovlivňuje p-hodnotu?
Hodnoty P jsou ovlivněny několika různými faktory: velikostí vzorku, velikostí účinku a typem testu a jeho předpoklady.
- Velikost vzorku: čím větší je skupina, tím rychleji získáte statisticky významné výsledky při malých rozdílech - a naopak.
- Velikost efektu: čím větší je velikost efektu, tím rychleji získáte statisticky významné výsledky, a to i u menších skupin - a naopak.
- Typ testu: test je citlivější na rozdíly s určitými předpoklady, např. o rozdělení dat, nezávislosti měr, homoskedasticitě, jednostranném vs. oboustranném testu, mezi skupinami vs. uvnitř skupin atd.
Např.
Obrovská studie může zjistit statisticky významné výsledky i u těch nejmenších účinků. Tyto účinky nemusí nic znamenat. V tomto bodě vstupuje do hry klinický význam.Původní studie s penicilinem používala malý vzorek, aby údaje ukázaly, že má obrovský vliv na eliminaci bakterií.
P-hodnota <0,05
Hranice statistické významnosti, kterou většina výzkumníků používá (tj. p < 0,05), je pouze arbitrární. Vše by se mělo měnit v závislosti na nastavení vaší studie. Pokud opravdu nechcete mít falešně pozitivní výsledky (např. rozhodnutí podstoupit život ohrožující operaci), potřebujete nízké prahové číslo. Pokud opravdu nechcete mít falešně negativní výsledky (např. při diagnostice agresivních nádorů), potřebujete vysoce výkonnoustudii s následně vyšším prahovým číslem p-hodnoty. To ilustruje vztah mezi chybami typu 1 (α) a typu 2 (ß ).
Upozorňujeme, že p-hodnota je odvozena z dat, nikoli z teorie. Svou teorii nemůžete "dokázat" statisticky významným efektem. Jediné, co můžete udělat, je pokusit se vyvrátit svou teorii pomocí různých studií, pokud to platí, vaše teorie platí. Jedná se o falzifikaci.
Mylné představy o p-hodnotě
Mezi časté mylné představy o p-hodnotě v lékařském výzkumu patří:
- Významná p-hodnota znamená, že účinek nebo asociace jsou velké nebo klinicky významné.
- Realita: Hodnota p udává pouze pravděpodobnost získání pozorovaného výsledku nebo extrémnějšího výsledku při nulové hypotéze. Neposkytuje informace o velikosti nebo klinickém významu účinku nebo asociace.
- Nesignifikantní p-hodnota znamená, že neexistuje žádný účinek nebo souvislost.
- Realita: Nesignifikantní p-hodnota pouze naznačuje, že pozorovaný výsledek není statisticky významný, ale nemusí nutně znamenat, že neexistuje žádný účinek nebo souvislost. Může to být způsobeno nízkou statistickou silou nebo jinými faktory, jako je chyba měření nebo zavádějící proměnné.
- Univerzální hranicí statistické významnosti je p-hodnota 0,05.
- Realita: Volba hladiny významnosti závisí na kontextu a měla by být založena na faktorech, jako je design studie, velikost vzorku a důsledky chyby typu I. V některých situacích může být vhodná nižší hladina významnosti, například ve studiích s vícenásobným srovnáváním nebo s vysokými sázkami.
- Významná p-hodnota dokazuje příčinnou souvislost.
- Realita: Statistická významnost udává pouze pravděpodobnost získání pozorovaného výsledku nebo extrémnějšího výsledku při nulové hypotéze. Neprokazuje příčinnou souvislost, která vyžaduje další důkazy na základě designu studie, biologické věrohodnosti a dalších faktorů.
- Velká velikost vzorku vždy vede k významné p-hodnotě.
- Realita: Velká velikost vzorku zvyšuje sílu detekce účinku nebo asociace, ale nezaručuje významnou p-hodnotu. Při určování statistické významnosti hraje roli také velikost účinku, variabilita a další faktory.
Odkazy
Elkins, M. R., Pinto, R. Z., Verhagen, A., Grygorowicz, M., Söderlund, A., Guemann, M., Gómez-Conesa, A., Blanton, S., Brismée, J. M., Agarwal, S., Jette, A., Karstens, S., Harms, M., Verheyden, G., & Sheikh, U. (2022). Statistická inference prostřednictvím odhadu: doporučení Mezinárodní společnosti editorů fyzioterapeutických časopisů. The Journal of manual & manipulative therapy, 30(3), 133-138.
Neyman, J. a Pearson, E.S. (1928) O použití a interpretaci některých testových kritérií pro účely statistické inference. Biometrika, 20A, 175-240.
Líbí se vám, co se učíte?
KOUPIT CELOU KNIHU PRO HODNOCENÍ FYZIOTUTORŮ
- Více než 600 stran e-knihy
- Interaktivní obsah (přímá videoukázka, články PubMed)
- Statistické hodnoty pro všechny speciální testy z nejnovějšího výzkumu
- K dispozici na 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷.
- A mnoho dalšího!