学习
什么是统计能力?| 统计
功率是一系列相同研究检测出具有统计学意义的影响(如 p<0.05)的长期概率。 在一系列相同的研究中,出现2 型错误的概率是功率(1-ß,通常为 20%)减去 1。
例如
100 项研究在同一人群中进行,采用相同的治疗 A 与治疗 B 结构。 在现实生活中,A 和 B 之间真正的治疗差异是 A 治疗完全康复的几率要高出 30%。对这 100 项研究进行统计(相同的人群、相同的方差、相同的标准差),平均约有 20 项研究不会显示出具有统计学意义的效果。 这就是第二类错误率或假阴性率--与统计能力(1-ß)直接相关。
因此,简单地说,动力不足的研究较少会显示出具有统计学意义的效果,而实际上是存在差异的。
这影响了功率
功率受几个因素的影响,就像p 值一样。
- 样本量:样本量越大 = 能力越强(组间差异越明显,数据噪音越小)
- 方差:方差越小 = 功率越大
- 效应大小:更大的效应大小 = 更强的能力(更容易通过测试发现)
- 统计检验的类型:有些检验会产生更强的能力,但需要更多的假设(统计中没有免费的午餐)。
但必须明白的是,统计能力(如 80%)是针对一种测量工具、一个时间点、一种效应大小而言的。
功率低 = 研究不可靠
因此,研究力量不足会增加第二类错误(假阴性)的风险,但同时也会增加第一类错误(假阳性)的风险,从而夸大效果。 这就是所谓的 "胜利者的诅咒"。 这就是为什么你根本无法在一个样本量中加入多个结果测量指标,并在多个时间点进行测量,而不使统计能力崩溃的原因。 优秀的研究人员和临床医生都知道,次要结果测量仅仅是提示性的,因为研究并不具备测量这些结果的能力。 你需要新的研究来证实这些建议。 上述问题被称为多重比较问题。
我可以想象这听起来有点违背直觉。 我们来看一个例子。
例如
您正在给 200 名学生讲课,决定将他们分成两组。 您的研究目的是了解是否存在性别差异,比如一组中女性人数多于另一组。 没有区别。 然后再看眼睛颜色、头发颜色、食指长度、卧推成绩、QOL、年龄、兄弟姐妹数量等。 你有可能会在某个地方遇到具有统计学意义的结果。 这就是多重比较问题。
解决方案
为了避免研究力量不足以及出现假阳性或假阴性的风险,研究人员在规划研究时必须有足够的研究力量。 这就需要考虑样本量、效应大小、方差和所使用的统计检验等因素。 多重测试也会带来误报风险,这可以通过调整显著性水平或使用误报率控制等方法来解决。 通过了解统计能力的概念及其在假设检验中的重要性,研究人员可以设计出产生可靠而有意义结果的研究。
参考资料
喜欢你正在学习的东西吗?
购买物理治疗师评估全书
- 600 多页电子书
- 互动内容(直接视频演示、PubMed 文章)
- 最新研究得出的所有特殊测试的统计值
- 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
- 还有更多!