티스토리 뷰

Data Science

카이제곱 검정

yj95 2024. 4. 22. 21:26
반응형

범주형 자료 분석 - 피어슨 검정

1) 적합도 검정 (goodness of fit test)

- 관측값들이 어떤 이론적 분포를 따르고 있는지 검정 (보통 한 개의 요인 대상)

ex) 맨델의 유전법칙 : 완두콩 교배 실험 9:3:3:1

 

2) 독립성 검정 (test of independence)

- 서로 다른 요인들에 의해 분할되어 있는 경우 그 요인들이 관찰값에 영향을 주고 있는지 아닌지, 요인들이 서로 연관이 있는지 없는지를 검정 (두 개의 요인 대상)

ex) 성별과 흡연/비흡연 여부

 

3) 동질성 검정 (test of homogeneity)

- 관측값들이 정해진 범주 내에서 서로 비슷하게 나타나고 있는지를 검정

- 속성 A, B를 가진 부모집단 각각으로부터 정해진 표본의 크기만큼 자료를 추출하는 경우에 분할표에서 부모집단의 비율이 동일한가를 검정

ex) 성별에 따라 선호하는 과목이 동일하다 / 차이가 있다

 

카이제곱통계량 = ∑(O-E)^2/E ~ 자유도 (행수-1)*(열수-1)

분할표의 각 칸의 기대 도수가 5 이하인 셀 20% 이상이면 사용할 수 없음

-> 카이제곱검정은 대표본에서만 유효한 근사 검정이므로 5 이하인 경우 피셔의 정확 검정 (Fisher's Exact Test)

 

반응형
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
글 보관함