통계적 가설 검정(Statistical Hypothesis Testing)
가설 검정 3단계
가설 설정
- 귀무가설(Null Hypothesis, H0) : 현재의 상황이나 통념
- 대중 주장(A) : 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 하지 않는다.
- 대립가설(Alternative Hypothesis, H1) : 새로운 현상이나 주장
- 나의 주장(B) : 현재 대한민국에 있는 양치기들은 일반인 대비 거짓말을 많이 한다.
검정통계량 추정 및 유의수준 설정
- 검정 통계량(Test Statistics) : 귀무가설과 대립가설을 비교하기 위한 검증 통계량. 1회의 추정치라서 점추정 이라고도 한다.
- 정해진 방법은 없지만 두 샘플 집단을 각각 분석하기보다, 차이만 분석해서 반복하면 단순한 모형 분포를 알 수 있다.
- 예시) (양치기 거짓말 빈도 평균 - 일반인 거짓말 빈도 평균) / 일반인 거짓말 빈도 평균
- 신뢰구간(Confidence Interval) : 검정통계량을 여러 횟수로 측정한 범위로 구간추정 이라고도 한다.
- 유의수준(Significanat Level, a) : 분석가가 직접 설정한 오류 허용치
- 귀무가설이 참인데 잘못된 데이터 또는 실험으로 분석결과상 귀무가설이 틀렸다고 주장하게 될 분석가가 직접 설정한 허용 오류 최대치이다.
- 유의수준 5% : 통상 5%를 많이 사용하며, 100번중 5번이 허용오류최대치가 된다.
의사결정
- 유의확률(p-value) : 컴퓨터가 직접 계산한 오류치
- 그동안의 실험데이터에서 대립가설이 발생할 확률이다.
- 유의수준보다 p값이 크다면 귀무가설을 참으로 가정했을때, 극단적 통계치가 관측될 확률이 충분히 발생 가능하다고 판단하여, 귀무가설을 채택한다.
- 유의확률 10% > 유의수준 5% : 대립가설 발생확률 > 허용오류최대치
- ⇒ 대립가설은 귀무가설과 차이가 없는 정도니, 귀무가설이 참이다. (거짓말 차이 없음)
- 유의수준보다 p값이 작다면 귀무가설을 참으로 가정했을때, 극단적 통계치가 관측될 확률이 충분히 낮다고 판단하여, 귀무가설을 기각하고 대립가설을 채택한다.
- 유의확률 1% < 유의수준 5% : 대립가설 발생확률 < 허용오류최대치
- ⇒ 대립가설은 귀무가설과 차이가 있으니, 대립가설이 참이다. (거짓말 차이 있음)
참조
https://yozm.wishket.com/magazine/detail/1012/
p값? 신뢰구간? AB 테스트를 완성하는 통계 분석, 기본 개념 잡기 | 요즘IT
한 번이라도 AB 테스트를 돌려본다면 결과 분석이 생각보다 어려운 일임을 깨닫게 됩니다. 뻔히 눈에 보이는 결과, 수치인데 매번 해석하기가 난감합니다. 따라서 이번 글에서 AB 테스트 결과를
yozm.wishket.com
'퀀트 > 금융' 카테고리의 다른 글
금융 기본 지식 | 2. 경제지표 분석 (0) | 2023.02.17 |
---|---|
금융 기본 지식 | 1. 거시경제 환경 (0) | 2023.02.16 |
통계 | 3. 데이터 기반 의사결정 (0) | 2023.02.12 |
통계 | 2. 데이터의특성 확인을 위한 기술적 분석 (0) | 2023.02.11 |
통계 | 1. 데이터 분석 단계에서의 통계 (0) | 2023.02.10 |