퀀트/금융

통계 | 4. 통계적 가설 검정

만 기 2023. 2. 14. 18:53

 

통계적 가설 검정(Statistical Hypothesis Testing)

 

가설 검정 3단계

가설 설정

  • 귀무가설(Null Hypothesis, H0) : 현재의 상황이나 통념
    • 대중 주장(A) : 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 하지 않는다.
  • 대립가설(Alternative Hypothesis, H1) : 새로운 현상이나 주장
    • 나의 주장(B) : 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 한다.

 

검정통계량 추정 및 유의수준 설정

  • 검정 통계량(Test Statistics) : 귀무가설과 대립가설을 비교하기 위한 검증 통계량. 1회의 추정치라서 점추정 이라고도 한다.
    • 정해진 방법은 없지만 두 샘플 집단을 각각 분석하기보다, 차이만 분석해서 반복하면 단순한 모형 분포를 알 수 있다.
    • 예시) (양치기 거짓말 빈도 평균 - 일반인 거짓말 빈도 평균) / 일반인 거짓말 빈도 평균
    • 신뢰구간(Confidence Interval) : 검정통계량을 여러 횟수로 측정한 범위로 구간추정 이라고도 한다.
  • 유의수준(Significanat Level, a) : 분석가가 직접 설정한 오류 허용치
    • 귀무가설이 참인데 잘못된 데이터 또는 실험으로 분석결과상 귀무가설이 틀렸다고 주장하게 될 분석가가 직접 설정한 허용 오류 최대치이다.
    • 유의수준 5% : 통상 5%를 많이 사용하며, 100번중 5번이 허용오류최대치가 된다.

 

의사결정

  • 유의확률(p-value) : 컴퓨터가 직접 계산한 오류치
    • 그동안의 실험데이터에서 대립가설이 발생할 확률이다.
    • 유의수준보다 p값이 크다면 귀무가설을 참으로 가정했을때, 극단적 통계치가 관측될 확률이 충분히 발생 가능하다고 판단하여, 귀무가설을 채택한다.
      • 유의확률 10% > 유의수준 5% : 대립가설 발생확률 > 허용오류최대치
      • ⇒ 대립가설은 귀무가설과 차이가 없는 정도니, 귀무가설이 참이다. (거짓말 차이 없음)
    • 유의수준보다 p값이 작다면 귀무가설을 참으로 가정했을때, 극단적 통계치가 관측될 확률이 충분히 낮다고 판단하여, 귀무가설을 기각하고 대립가설을 채택한다.
      • 유의확률 1% < 유의수준 5% : 대립가설 발생확률 < 허용오류최대치
      • ⇒ 대립가설은 귀무가설과 차이가 있으니, 대립가설이 참이다. (거짓말 차이 있음)

 

참조

https://yozm.wishket.com/magazine/detail/1012/

 

p값? 신뢰구간? AB 테스트를 완성하는 통계 분석, 기본 개념 잡기 | 요즘IT

한 번이라도 AB 테스트를 돌려본다면 결과 분석이 생각보다 어려운 일임을 깨닫게 됩니다. 뻔히 눈에 보이는 결과, 수치인데 매번 해석하기가 난감합니다. 따라서 이번 글에서 AB 테스트 결과를

yozm.wishket.com