독립인 두 표본의 t-검정(2-sample t-test)
- 서로 상관없는 두 집단의 평균이 통계적으로 유의미하게 차이가 나는지 확인하는 방법
- 두 집단의 분산이 같은지 여부에 따라 수식이 달라지므로, 등분산 검정을 먼저해야함 (Levene 검정)
- 귀무가설
: (의미 : 두 집단의 분산은 같다.) - 대립가설
: (의미 : 두 집단의 분산은 같지 않다.) - 유의확률이 0.05보다 작으면 같지않음 (대립가설 채택)
- 귀무가설
- 가설
- 귀무가설
: -> 두 집단의 평균의 차는 0이다. (무죄추정) - 대립가설
: (유죄라고 증명해야함)
- 귀무가설
배경지식
전제조건
- 독립성: 두 집단의 구성원이 서로 겹치지 않아야함
- 정규성: 각 집단의 데이터가 정규분포를 따라야함 (데이터의 수가 30개 이상이면 보통 만족한다고 봄)
- 등분산성: 두 집단의 데이터가 퍼진 정도(분산)가 비슷해야함
독립인 두 표본의 t-검정
t-값
- 독립표본은 두 평균의 차이를 확인함
- 분자가 신호(차이), 분모가 오차인 것은 동일함, 하지만 분산의 일치여부에 따라 공식이 달라짐
- 분산이 같을때: 두 집단의 오차를 하나로 뭉쳐서 계산
- 분산이 다를때: 두 집단의 오차를 따로 계산
- 굳이 0을 빼는 이유는, 보통 귀무가설이 "두 집단의 차이가
이다" 라고 주장하는것을 명시하기 위함 - 만약에 점수 차이가 5다 라고 한다면, 5를 빼야함
비교
| 구분 | 단일표본 t-검정 | 독립표본 t-검정 |
|---|---|---|
| 비교 대상 | 한 집단 평균 vs 특정 숫자 | 두 집단 평균 vs 서로 |
| 자유도 ( |
||
| 핵심 전제 | 정규성 | 정규성 + 독립성 + 등분산성 |