평균 비교
- 추론통계: 전수조사를 하지 않고, 일부만 제대로 뽑아서 조사한 뒤, 전체도 이럴 확률이 95%다 라고 말하는 과정
- 대립가설을 검증하여, p-value가 0.05 보다 작으면, 전수조사 없이도, 우연일 확률이 5% 미만이므로 전체집단에서도 차이가 없다고 봐도 무방함
평균비교
- 관찰한 집단 간의 평균차이가 의미가 있는 차이인지, 우연히 발생한 차이인지 통계적으로 검증하는 과정
- 아래와 같은 종류가 있음
- 단일표본(One-sample t-test): 우리집단의 평균을 이미 알고있는 특정한 기준값과 비교
- 우리 회사의 신입사원의 평균 토익점수가 전국 평균(알려짐, 700점) 보다 높은가?
- 독립인 두 표본(Independent two-sample t-test): 서로 상관이 없는 2개의 집단의 평균이 서로 다른지 비교
- A 비타민을 먹은 그룹과 안먹은 그룹의 피로도 평균이 다른가?
- 대응표본(Paired-sample t-test): 동일한 집단의 전/후 비교, 같은 대상에게 어떤 조치를 하기
- 다이어트 약을 먹기 전과 먹고 난 후의 몸무게 평균이 다른가?
- 일원배치 분산분석(One-way ANOVA): 3개이상의 집단을 비교해야할때 사용 (t-test를 여러번하면 오류가 커지기 때문)
- 서울, 경기, 강원 지역별 아파트 가격의 평균이 서로 다른가?
- 이원배치 분산분석(Two-way ANOVA): 변수가 2개인 여러집단
- 성별(남녀)과 학력(고대졸)에 따라 연봉의 차이가 있는가?
- 단일표본(One-sample t-test): 우리집단의 평균을 이미 알고있는 특정한 기준값과 비교
| 분석 방법 | 비교 집단 수 | 특징 |
|---|---|---|
| 단일표본 | 1개 | 기준값(평균)과 비교 |
| 독립표본 | 2개 | 서로 다른 두 집단 비교 |
| 대응표본 | 1개 (2회 측정) | 동일 집단의 전/후 비교 |
| 일원배치 ANOVA | 3개 이상 | 한 가지 기준(요인)으로 집단 비교 |
| 이원배치 ANOVA | 3개 이상 | 두 가지 기준(요인)으로 집단 비교 |
배경지식
귀무가설과 대립가설
- 귀무가설(
, Null Hypothesis) - 차이가 없다, 효과가 없다, 기존과 같다 라고 가정하는 기본 상태
- 비유: 무죄 추정의 원칙, 피고인은 일단 무죄라고 가정하고 재판을 시작하는 것과 같음
- 특징: 귀무가설을 깨뜨리는것(기각)이 목적
- 차이가 없다, 효과가 없다, 기존과 같다 라고 가정하는 기본 상태
- 대립가설(
또는 , Alternative Hypothesis) - 차이가 있다, 효과가 있다, 기존과 다르다 라는 주장
- 비유: 입증하려는 유죄 주장, 연구자가 실험을 통해 진짜로 증명하고 싶은 내용
- 귀무가설이 틀렸다는 강력한 증거가 있을 때만 채택될 수 있음
- 차이가 있다, 효과가 있다, 기존과 다르다 라는 주장
유의확률
- 귀무가설이 맞다는 가정하에, 지금 같은 데이터가 나타날 확률
- 비유: 우연히 이런 증거가 발견될 확률
- 피고인이 무죄인데(귀무가설), 범행 현장에서 0.0001 정도로 희박하다. -> 유죄(대립가설 채택)
- p-value가 아주 작아야 대립가설 채택
- p-value가 크면 귀무가설을 버리지 못함
- 결정기준: 유의수준(
) 이 0.05 (5%) 면 우연이 아니라고 생각
- 비유: 우연히 이런 증거가 발견될 확률