단일표본(one-sample t-test)
단일표본
개요
- 집단 내 평균과 특정 값의 차이를 비교하는 방법
- 예시: 한국 고등학생 키 평균이 175cm 인지 궁금함
가설
- 귀무가설
: -> 어느집단의 평균은 이다. (무죄추정) - 대립가설
: (유죄라고 증명해야함) : 위의 두개를 모두 포함함 ( 보다 크거나 보다 작다)
- 유죄가 우연히 나올확률이 0.05보다 작으면
채택
배경지식
- 정규성 가정
- 단일표본 t-검정을 하려면, 데이터가 정규분포 모양을 그리고 있어야함
- 데이터가 너무 적거나, 한쪽으로 치우쳐 있다면 t-검정 결과는 믿을 수 없음 -> 비모수 검정을 사용해야함
- 단일표본 t-검정을 하려면, 데이터가 정규분포 모양을 그리고 있어야함
단일표본 분석
- t-분포: 정규분포를 따르는 모집단에서 뽑은 샘플의 분포를 설명하는 그래프
- t-값
- 아래와 같은 t-값이라는 점수를 계산
: 표본 평균 : 내가 비교하고 싶은 기준값 (175cm) : 표준오차 (데이터의 흩어진 정도) - 표본평균과 기준값의 차이(측정한 오차)와 표준오차를 비교
-> 불확실성에 비해 차이가 클때, 우연이 아니라 진짜 차이가 있다고 생각
- 아래와 같은 t-값이라는 점수를 계산
- t-값과 p-value
- t-분포라는 그래프의 x축에 찍히는 위치에서 꼬리 면적을 구하면 됨
- 자유도: t-분포의 모양을 결정하는 요소
- 샘플개수 n 에 따라 n-1을 자유도로 사용
- 샘플이 적으면 그래프가 옆으로 퍼지고(불확실성 증가), 많으면 뾰족해지기 때문

- 양측검정 (
): "다르기만 하면 돼!" - 양쪽 꼬리를 더해야함
- -> 우연일 확률이 더 높아짐, 더 큰 도메인을 커버기 때문
- 단측검정 (
): "무조건 커야 해!" (혹은 반대) - 한쪽 꼬리만 더하면됨
- 단일표본 분석을 할때는, 위에 설명한 것과 같이 표본평균, s, n 을 계산하여 대입하면 됨