통계 | 4. 통계적 가설 검정

퀀트/금융

만 기 2023. 2. 14. 18:53

통계적 가설 검정(Statistical Hypothesis Testing)

가설 설정

귀무가설(Null Hypothesis, H0) : 현재의 상황이나 통념
- 대중 주장(A) : 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 하지 않는다.
대립가설(Alternative Hypothesis, H1) : 새로운 현상이나 주장
- 나의 주장(B) : 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 한다.

검정통계량 추정 및 유의수준 설정

검정 통계량(Test Statistics) : 귀무가설과 대립가설을 비교하기 위한 검증 통계량. 1회의 추정치라서 점추정 이라고도 한다.
- 정해진 방법은 없지만 두 샘플 집단을 각각 분석하기보다, 차이만 분석해서 반복하면 단순한 모형 분포를 알 수 있다.
- 예시) (양치기 거짓말 빈도 평균 - 일반인 거짓말 빈도 평균) / 일반인 거짓말 빈도 평균
- 신뢰구간(Confidence Interval) : 검정통계량을 여러 횟수로 측정한 범위로 구간추정 이라고도 한다.
유의수준(Significanat Level, a) : 분석가가 직접 설정한 오류 허용치
- 귀무가설이 참인데 잘못된 데이터 또는 실험으로 분석결과상 귀무가설이 틀렸다고 주장하게 될 분석가가 직접 설정한 허용 오류 최대치이다.
- 유의수준 5% : 통상 5%를 많이 사용하며, 100번중 5번이 허용오류최대치가 된다.

의사결정

유의확률(p-value) : 컴퓨터가 직접 계산한 오류치
- 그동안의 실험데이터에서 대립가설이 발생할 확률이다.
- 유의수준보다 p값이 크다면 귀무가설을 참으로 가정했을때, 극단적 통계치가 관측될 확률이 충분히 발생 가능하다고 판단하여, 귀무가설을 채택한다.
  - 유의확률 10% > 유의수준 5% : 대립가설 발생확률 > 허용오류최대치
  - ⇒ 대립가설은 귀무가설과 차이가 없는 정도니, 귀무가설이 참이다. (거짓말 차이 없음)
- 유의수준보다 p값이 작다면 귀무가설을 참으로 가정했을때, 극단적 통계치가 관측될 확률이 충분히 낮다고 판단하여, 귀무가설을 기각하고 대립가설을 채택한다.
  - 유의확률 1% < 유의수준 5% : 대립가설 발생확률 < 허용오류최대치
  - ⇒ 대립가설은 귀무가설과 차이가 있으니, 대립가설이 참이다. (거짓말 차이 있음)

p값? 신뢰구간? AB 테스트를 완성하는 통계 분석, 기본 개념 잡기 | 요즘IT

한 번이라도 AB 테스트를 돌려본다면 결과 분석이 생각보다 어려운 일임을 깨닫게 됩니다. 뻔히 눈에 보이는 결과, 수치인데 매번 해석하기가 난감합니다. 따라서 이번 글에서 AB 테스트 결과를

yozm.wishket.com

만기레벨업일지

감정은 사라지고 결과는 남는다.

확률, Django, HTML, 전처리, .corr(), CNN, django app, Python, CSS, flask, docker, jwt, 머신러닝, DRF, pandas, Plot, django orm, 스파르타코딩클럽, 금융공학, 퀀트,