学ぶ
アルファ・レベルとは何か?| 統計
頻出統計学では、アルファ水準(有意水準とも呼ばれる)は帰無仮説が真である場合に棄却される確率である。 理学療法研究の文脈では、帰無仮説は、2つの異なる理学療法介入間で痛みの軽減に差がないということになるかもしれない。 アルファレベルは通常0.05に設定されるが、これは、帰無仮説を誤って棄却する(つまり、実際には痛みの軽減に差がないのに、差があると結論づける)確率が長期的に5%あることを意味する。
長期的な結果として考えることが特に重要である。 同様の研究が100件実施された場合、そのうちの平均5件は、効果がなければ偽陽性の結果を示すことになる。
例を挙げて説明する
腰痛に対する2つの理学療法介入を比較した研究があり、その結果、介入Aの平均疼痛軽減は疼痛スケールで6点、介入Bの平均疼痛軽減は疼痛スケールで8点であったとしよう。 αレベルを0.05とすると、研究者は帰無仮説を棄却し、平均値の差が偶然に予想される値よりも大きいため、2つの介入法の間には痛みの軽減に統計的に有意な差があると結論づけるだろう。
p<0.05?
アルファ値を0.05とするのは慣例であり、ルールではないことに注意することが重要である。 αレベルの選択は、研究の背景と偽陽性または偽陰性の結果がもたらす潜在的な影響に依存する。 例えば、偽陽性(治療が有効でないにもかかわらず、有効であると結論づけること)の結果がより深刻である場合、研究者は偽陽性の確率を下げるために、より低いアルファ水準(例えば0.01)を使用することを選択するかもしれない。
長期的展望
長期的な視野の重要性を改めて強調したい。 その論文が偽陽性になる可能性が5%あると単純に言うことはできない。 調査が実施されれば、それは単に偽陽性であるか、そうでないかである。 5%は長期的な結果を物語っている。 同じような条件の複数の研究でこのテストを行うと、論文の約5%が偽陽性となる。
理学療法介入は腰痛の軽減に非常に効果的であるように見えるが、p値が小さく(統計的に有意な差を示す)、効果量が大きい。 しかし、この単一の研究が他の研究で再現されない場合、その結果が偶然によるものなのか、本当の効果なのかを判断するのは難しい。
長期的な視点は、介入の有効性をより包括的に理解するために、長期にわたる複数の研究結果を考慮する。 このアプローチは理学療法研究において特に重要であり、単一研究の結果が他の集団や環境に一般化されない可能性がある。
誤解
p値にまつわるよくある誤解がいくつかある:
- P値は証拠の強さの尺度である: p値は帰無仮説に対する証拠の強さを測定するものではなく、帰無仮説が真であると仮定した場合に、検定統計量が観測されたものと同じか、それよりも極端に観測される確率を測定するものである。
- p値が小さいということは、帰無仮説に対する強い証拠を意味する: p値が小さいのは、データが帰無仮説と一致しないことを示すだけで、対立仮説の証拠にはならない。 さらに、p値が小さいからといって、その効果が大きかったり重要であったりするわけではない。
- P値が0.05というのは、有意性を示すハードな閾値である: 0.05という閾値は恣意的なもので、統計的有意性を示す従来のカットオフ値として採用されているが、p値が0.05より大きい結果が自動的に有意でないという意味ではない。 p値の解釈は、文脈や研究課題によって異なる。
- P値は帰無仮説が真である確率である: p値は帰無仮説が真である確率ではなく、帰無仮説が真である場合にデータを観測する確率である。
- P値は因果関係の推論に使用できる: p値は帰無仮説に対する証拠を提供するだけであり、必ずしも因果関係を示唆するものではない。 因果関係の推論には、交絡因子を適切にコントロールしたよくデザインされた研究などの追加情報が必要である。
P値の詳細については、こちらを参照のこと。 詳しくはこちらの記事をご覧いただきたい!
今学んでいることが好きか?
フィジオチューターアセスメントブックを購入する
- 600ページ以上の電子書籍
- インタラクティブ・コンテンツ(ダイレクト・ビデオ・デモンストレーション、PubMed記事)
- 最新の研究によるすべての特別検査の統計値
- 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷 で利用できる。
- その他にもいろいろある!