Wiki 통계 및 방법론

P-값이란 무엇인가요? | 통계

스토어 확인
P-값이란 무엇인가요?
피지오튜터 플랫폼에서 이 위키 찾기 회원 가입하기

학습

P-값이란 무엇인가요? | 통계

간단히 말해서 p-값은 효과가 없다고 가정했을 때 데이터에 얼마나 놀랐는지를 표현합니다. p값이 낮을수록 데이터가 모델과 더 호환되지 않는 것으로 보입니다(즉, 효과가 없다는 가정).

예.

처리 A를 처리 B와 비교하면 효과가 없거나 차이가 없다고 가정하고 귀무 가설이 맞을 것으로 기대합니다. 테스트를 수행한 결과 p값이 0.02로 나옵니다. 즉, 두 그룹이 차이가 없을 것이라고 가정하고 수집한 데이터는 꽤 놀랍습니다.

p값은 무작위성으로부터 자신을 보호하기 위해 존재합니다. 연구를 수행하다 보면 보이는 효과가 무작위 또는 데이터 노이즈에 불과할 가능성이 있습니다. 그렇기 때문에 그룹 간 평균값에 눈에 띄는 차이가 있을 수 있지만 통계적으로 유의미한 효과는 나타나지 않습니다. 그 반대의 경우도 마찬가지입니다. 연구 결과가 유의미하지 않은 것으로 나타났지만 표본 크기가 너무 작아서 실제 효과가 있을 수도 있습니다.

 

p값에 영향을 미치는 요인은 무엇인가요?

P값은 표본 크기, 효과 크기, 가정이 있는 테스트 유형 등 몇 가지 다른 요소의 영향을 받습니다.

  • 표본 크기: 그룹이 클수록 작은 차이로 통계적으로 유의미한 결과를 더 빨리 얻을 수 있으며, 그 반대의 경우도 마찬가지입니다.
  • 효과 크기: 효과 크기가 클수록 소규모 그룹에서도 통계적으로 유의미한 결과를 더 빨리 얻을 수 있으며, 그 반대의 경우도 마찬가지입니다.
  • 테스트 유형: 테스트는 데이터 분포, 측정값의 독립성, 동형 공분산, 일면 대 양면, 그룹 간 대 그룹 내 등 특정 가정에 따른 차이에 더 민감해집니다.

예. 

대규모 연구에서는 아주 작은 효과라도 통계적으로 유의미한 결과를 찾을 수 있습니다. 이러한 효과는 아무 의미가 없을 수도 있습니다. 원래 페니실린 연구는 박테리아 제거에 큰 효과가 있다는 데이터를 만들기 위해 작은 샘플을 사용했는데, 이것이 바로 임상적 중요성이 작용하는 부분입니다.

 

P-값 <0.05 임계값

대부분의 연구자들이 사용하는 통계적 유의성의 임계값(즉, p <0.05)은 임의로 설정할 수 있습니다. 모든 것을 고려할 때, 학습 설정에 따라 변경해야 합니다. 생명을 위협하는 수술 결정과 같은 오탐 결과를 정말로 원하지 않는다면 임계값을 낮게 설정해야 합니다. 위음성(예: 공격적인 종양 진단)을 정말로 원하지 않는다면, 더 높은 p값 임계값을 가진 고성능연구가 필요합니다. 이는 유형 1(α)유형 2(ß ) 오류 사이의 주고받기 관계를 보여줍니다.

p-값은 이론이 아닌 데이터에서 도출된 값이라는 점에 유의하세요. 통계적으로 유의미한 효과로 이론을 '증명'할 수는 없습니다. 여러분이 할 수 있는 유일한 일은 다른 연구로 여러분의 이론을 반박하는 것뿐이며, 만약 그것이 타당하다면 여러분의 이론은 유효합니다. 이것은 위조입니다.

p값에 대한 오해

의학 연구에서의 p값에 대한 몇 가지 일반적인 오해는 다음과 같습니다:

  • 유의미한 p값은 효과 또는 연관성이 크거나 임상적으로 유의미하다는 것을 의미합니다.
  • 유의하지 않은 p값은 효과 또는 연관성이 없음을 의미합니다.
    • 현실: 유의하지 않은 p값은 관찰된 결과가 통계적으로 유의하지 않다는 것을 의미할 뿐, 반드시 효과나 연관성이 없다는 것을 의미하지는 않습니다. 통계적 검정력이 낮거나 측정 오류 또는 교란 변수와 같은 기타 요인 때문일 수 있습니다.
  • p값 0.05는 통계적 유의성에 대한 보편적인 임계값입니다.
    • 현실: 유의 수준 선택은 상황에 따라 다르며 연구 설계, 표본 크기, 유형 I 오류의 결과와 같은 요소를 기반으로 해야 합니다. 다중 비교 또는 높은 이해관계가 있는 연구와 같은 일부 상황에서는 더 낮은 유의 수준이 적절할 수 있습니다.
  • 유의미한 p값은 인과 관계를 입증합니다.
    • 현실: 통계적 유의성은 귀무 가설 하에서 관찰된 결과 또는 그 이상의 극단적인 결과를 얻을 가능성만을 나타냅니다. 연구 설계, 생물학적 타당성 및 기타 요인에서 추가적인 증거가 필요한 인과관계를 입증하지는 않습니다.
  • 표본 크기가 크면 항상 유의미한 p-값을 얻게 됩니다.
    • 현실: 표본 크기가 크면 효과 또는 연관성을 감지할 수 있는 파워는 증가하지만 유의미한 p-값을 보장하지는 않습니다. 효과 크기, 변동성 및 기타 요인도 통계적 유의성을 결정하는 데 중요한 역할을 합니다.

참조

엘킨스, M. R., 핀토, R. Z., 베르하겐, A., 그리고로비치, M., 쇠더룬드, A., 구만, M., 고메즈-콘사, A., 블랜튼, S., 브리스메, J. M., 아가르왈, S., 제트, A., 카스텐, S., 해즈, M., 베르하이덴, G., & 셰이크, U.. (2022). 추정을 통한 통계적 추론: 국제 물리치료 학회 저널 편집자의 권장 사항. 수동 및 조작 치료 저널, 30(3), 133-138.
네이먼, J. 및 피어슨, E.S. (1928) 통계적 추론을 위한 특정 테스트 기준의 사용과 해석에 관한 연구. 바이오메트리카, 20A, 175-240.

그린란드, S., 센, S. J., 로스만, K. J., 칼린, J. B., 풀, C., 굿맨, S. N., & 알트만, D. G. (2016). 통계 테스트, P값, 신뢰 구간 및 검정력: 잘못된 해석에 대한 가이드입니다. 유럽 역학 저널, 31(4), 337-350.

캠퍼 S. J. (2019). 결과 해석 2-통계적 유의성 및 임상적 의미: 증거를 실무에 연결하기. 정형외과 및 스포츠 물리 치료 저널, 49(7), 559-560. 

칼 포퍼, 추측과 반박, 런던: 1963년, 33-39쪽; Theodore Schick, 편집자, 과학 철학 읽기, 캘리포니아주 마운틴뷰에서 발췌: 메이필드 출판사, 2000, 9-13페이지

Christley, R.M. (2010). 전원 및 오류: 힘이 부족한 연구에서 위양성 결과의 위험 증가. 개방형 역학 저널, 3, 16-19.

플레밍 A. 페니실륨 배양균의 항균 작용에 관한 연구, 특히 B. 인플루엔자 분리에서의 사용과 관련하여. Br J Exp Pathol. 1929 Jun;10(3):226-36. PMCID: PMC2048009.

Erickson, R. A., & Rattner, B. A. (2020). 생태독성학에서 p <0.05를 넘어서기: 실무자를 위한 가이드. 환경 독성학 및 화학, 39(9), 1657-1669.

배우고 있는 내용이 마음에 드시나요?

피지오튜터 평가서 전문 구매하기

  • 600페이지 이상의 전자책
  • 대화형 콘텐츠(직접 비디오 데모, PubMed 문서)
  • 최신 연구의 모든 특별 시험에 대한 통계 값
  • 🇬🇧 🇩🇪 🇫🇷 🇪🇸 🇮🇹 🇵🇹 🇹🇷
  • 그리고 훨씬 더!
빅 프린트 복 5.2

평가 전자책에 대한 고객의 의견

지금 무료 피지오튜터 앱을 다운로드하세요!

그룹 3546
모바일 이미지 다운로드
모바일 앱 목업
앱 로고
앱 목업
한 권의 책에서 모든 것을 확인하세요!
무료 앱 다운로드