Leer
Wat is statistisch vermogen? | Statistieken
De power is de waarschijnlijkheid op lange termijn van een reeks identieke onderzoeken om een statistisch significant effect (bijv. p<0,05) te detecteren als dat er is. De kans op een type 2 fout in een reeks identieke onderzoeken is één min de power (1-ß, vaak 20%).
Bijvoorbeeld.
Honderd studies worden uitgevoerd binnen dezelfde populatie met dezelfde behandeling A versus behandeling B structuur. Het werkelijke verschil in behandeling tussen A en B is een 30% hogere kans op volledig herstel bij behandeling A. Wanneer de statistieken worden uitgevoerd op deze honderd studies (zelfde populatie, zelfde variantie, zelfde standaardafwijking), zullen gemiddeld ongeveer 20 studies geen statistisch significant effect laten zien. Dit is het type 2 foutenpercentage, of fout-negatieve resultaten - direct gerelateerd aan de statistische power (1-ß).
Eenvoudig gezegd zal een studie met onvoldoende vermogen dus minder vaak een statistisch significant effect aantonen, terwijl er wel degelijk een verschil is.
Dit beïnvloedt het vermogen
Macht wordt beïnvloed door een paar factoren, net als bij p-waarden.
- Steekproefgrootte: grotere steekproef = meer vermogen (duidelijkere verschillen tussen groepen, minder gegevensruis)
- Variantie: kleinere variantie = meer vermogen
- Effectgroottes: grotere effectgroottes = meer power (gemakkelijker te herkennen aan een test)
- Type statistische test: sommige tests leveren meer vermogen op in ruil voor meer aannames (er zijn geen gratis lunches in statistieken).
Het is echter van cruciaal belang te begrijpen dat het statistisch vermogen (bv. 80%) is er voor één meetinstrument, voor één tijdstip, voor één effectgrootte.
Laag vermogen = onbetrouwbare studie
Dus een onderbezet onderzoek verhoogt het risico op type 2 fouten (fout-negatieven), maar het verhoogt ook het risico op type 1 fouten (fout-positieven), met opgeblazen effecten. Dit wordt 'de vloek van de winnaar' genoemd. Dit is de reden waarom je simpelweg niet meerdere uitkomstmaten op een steekproefgrootte kunt gooien en op meerdere tijdstippen kunt meten zonder je statistische power te laten crashen. Goede onderzoekers en clinici weten dat secundaire uitkomstmaten slechts suggestief zijn omdat het onderzoek niet geschikt is voor dat aantal metingen. Je hebt nieuwe onderzoeken nodig om die suggesties te bevestigen. Het hierboven beschreven probleem wordt het meervoudige vergelijkingsprobleem genoemd.
Ik kan me voorstellen dat dit een beetje contra-intuïtief klinkt. Laten we een voorbeeld bekijken.
Bijvoorbeeld.
Je geeft les aan een groep van 200 studenten en besluit ze in twee groepen op te splitsen. Het doel van je onderzoek is om te kijken of er sekseverschillen zijn, zoals meer vrouwen in de ene groep vergeleken met de andere. Er is geen verschil. Dan kijk je naar kleur ogen, haarkleur, lengte van hun wijsvinger, benchpress PR, QOL, leeftijd, aantal broers en zussen, enz. De kans is groot dat je ergens een statistisch significant resultaat tegenkomt. Dit is het meervoudige vergelijkingsprobleem.
Oplossingen
Om studies met te weinig power en het risico op fout-positieven of fout-negatieven te vermijden, moeten onderzoekers hun studies plannen met voldoende power. Hiervoor moet rekening worden gehouden met factoren zoals steekproefgrootte, effectgrootte, variantie en de gebruikte statistische test. Meervoudige tests vormen ook een risico op fout-positieven, die kunnen worden aangepakt met methoden zoals het aanpassen van het significantieniveau of het gebruik van False Discovery Rate controle. Door het concept van statistisch vermogen en het belang ervan bij het testen van hypothesen te begrijpen, kunnen onderzoekers onderzoeken ontwerpen die betrouwbare en betekenisvolle resultaten opleveren.
Bronnen
Vind je het leuk wat je leert?
KOOP HET VOLLEDIGE FYSIOTOREN BEOORDELINGSBOEK
- 600+ Pagina's e-Boek
- Interactieve inhoud (directe videodemonstratie, PubMed-artikelen)
- Statistische waarden voor alle speciale testen uit het laatste onderzoek
- Beschikbaar in 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- En nog veel meer!