使用代码 WINTER10 可为在线课程节省 10% 的费用!
00
00
00
00
申请退款
维基 统计与方法

什么是 P 值?| 统计

查看我们的商店
什么是 P 值?
在 Physiotutors 平台上查找此维基 成为会员

学习

什么是 P 值?| 统计

简单来说,P 值表示在假设没有影响的情况下,您对数据的惊讶程度。 p 值越小,数据似乎越不符合您的模型(即没有影响的假设)。

例如

将 A 治疗方法与 B 治疗方法进行比较,假设没有效果或没有差异;您期望零假设是正确的。 您进行了测试,得到的 p 值为 0.02。 这意味着,考虑到您假设各组之间不会有差异,您收集到的数据非常令人惊讶。

P 值的存在是为了保护自己免受随机性的影响。 如果你进行一项研究,你所看到的效果很可能只是随机的,或者我们称之为数据噪音。 这就是为什么你可能会看到组间平均值有明显差异,但在统计上却没有显著影响的原因。 也可以反过来。 一项研究可能显示出不显著的结果,但可能存在真正的影响;也许是因为样本量太小。

 

是什么影响了 p 值?

P 值受几个不同因素的影响:样本量、效应大小、测试类型及其假设。

  • 样本量:群体越大,差异越小,就越快得到有统计学意义的结果,反之亦然。
  • 效应大小:效应大小越大,即使小组规模较小,也能更快地获得有统计学意义的结果,反之亦然
  • 检验类型:检验对数据分布、测量的独立性、同方差、单侧与双侧、组间与组内等假设的差异更加敏感。

例如 

即使是最微小的影响,庞大的研究也能发现具有统计意义的结果。 这些影响可能毫无意义。 这就是临床意义所在。最初的青霉素研究使用了很小的样本,使数据显示出消除细菌的巨大作用。

 

P 值 <0.05 临界值

大多数研究人员使用的统计显著性阈值(即 p < 0.05)只是任意设定的。 综合考虑,它应该根据您的研究设置而变化。 如果您真的不希望出现假阳性结果(例如,决定进行危及生命的手术),就需要一个较低的阈值。 如果您真的不希望出现假阴性(如诊断侵袭性肿瘤),您就需要进行高功率研究,并随后获得更高的 p 值临界值。 这说明了类型 1 (α)类型 2 (ß)误差之间的取舍关系。

请注意,P 值是根据数据而不是理论得出的。 你不能用统计学上的显著效果来 "证明 "你的理论。 你唯一能做的就是尝试用不同的研究来反驳你的理论,如果它成立,你的理论也就成立了。 这就是伪造。

关于 p 值的误解

医学研究中关于 p 值的一些常见误解包括

  • 显着的 p 值意味着效应或关联很大或具有临床意义。
  • p 值不显著意味着没有影响或关联。
    • 现实 不显著的 p 值仅表明观察到的结果在统计上不显著,但并不一定意味着没有影响或关联。 这可能是由于统计能力较低或其他因素,如测量误差或混杂变量。
  • 0.05 的 p 值是统计显著性的通用阈值。
    • 现实 显著性水平的选择取决于具体情况,并应基于研究设计、样本量和I 类错误的后果等因素。 在某些情况下,例如在有多重比较或重大风险的研究中,较低的显著性水平可能是合适的
  • 显著的 p 值证明了因果关系。
    • 现实 统计意义只表示在零假设下获得观察结果或更极端结果的可能性。 它并不能确定因果关系,这需要研究设计、生物合理性和其他因素提供更多证据。
  • 样本量越大,P 值越大。
    • 现实 样本量越大,检测效应或关联的能力越强,但并不能保证 p 值显著。 效应大小、变异性和其他因素也是决定统计意义的一个因素。

参考资料

Elkins, M. R.、Pinto, R. Z.、Verhagen, A.、Grygorowicz, M.、Söderlund, A.、Guemann, M.、Gómez-Conesa, A.、Blanton, S.、Brismée, J. M.、Agarwal, S.、Jette, A.、Karstens, S.、Harms, M.、Verheyden, G., & Sheikh, U. (2022). 通过估算进行统计推断:国际物理治疗期刊编辑协会的建议。 手法与操作疗法杂志》,30(3),133-138
奈曼,J.和皮尔逊,E.S. (1928) On the Use and Interpretation of Certain Test Criteria for the Purposes of Statistical Inference. Biometrika, 20A, 175-240.

Greenland, S., Senn, S. J., Rothman, K. J., Carlin, J. B., Poole, C., Goodman, S. N., & Altman, D. G. (2016). 统计检验、P 值、置信区间和功率:误读指南。 欧洲流行病学杂志》,31(4),337-350 页。

Kamper S. J. (2019). 结果解读 2-统计意义和临床意义: 将证据与实践联系起来。 矫形和运动理疗杂志》,49(7),559-560 页。 

卡尔-波普尔:《猜想与反驳》,伦敦: Routledge and Keagan Paul,1963 年,第 33-39 页;摘自 Theodore Schick 编著的《科学哲学读本》,加利福尼亚州山景城: 梅菲尔德出版公司,2000 年,第 9-13 页

克里斯特里,R.M. (2010). 权力与错误 在动力不足的研究中出现假阳性结果的风险增加。 开放流行病学杂志》,3,16-19。

弗莱明-A.《青霉培养物的抗菌作用,特别是在分离流感杆菌中的应用》。 Br J Exp Pathol. 1929 Jun;10(3):226-36. PMCID: PMC2048009。

Erickson, R. A., & Rattner, B. A. (2020). 超越生态毒理学中的 p < 0.05: 从业人员指南》。 环境毒理学与化学》,39(9),1657-1669。

喜欢你正在学习的东西吗?

购买物理治疗师评估全书

  • 600 多页电子书
  • 互动内容(直接视频演示、PubMed 文章)
  • 最新研究得出的所有特殊测试的统计值
  • 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
  • 还有更多!
大印花布 5.2

客户对评估电子书的评价

立即下载免费的 Physiotutors 应用程序!

第 3546 组
下载移动图片
移动应用程序模型
应用程序徽标
应用程序模型
查看我们的全功能图书!
下载我们的免费APP