티스토리 뷰

Data Science

카이제곱 검정

yj95 2024. 4. 22. 21:26
반응형

범주형 자료 분석 - 피어슨 검정

1) 적합도 검정 (goodness of fit test)

- 관측값들이 어떤 이론적 분포를 따르고 있는지 검정 (보통 한 개의 요인 대상)

ex) 맨델의 유전법칙 : 완두콩 교배 실험 9:3:3:1

 

2) 독립성 검정 (test of independence)

- 서로 다른 요인들에 의해 분할되어 있는 경우 그 요인들이 관찰값에 영향을 주고 있는지 아닌지, 요인들이 서로 연관이 있는지 없는지를 검정 (두 개의 요인 대상)

ex) 성별과 흡연/비흡연 여부

 

3) 동질성 검정 (test of homogeneity)

- 관측값들이 정해진 범주 내에서 서로 비슷하게 나타나고 있는지를 검정

- 속성 A, B를 가진 부모집단 각각으로부터 정해진 표본의 크기만큼 자료를 추출하는 경우에 분할표에서 부모집단의 비율이 동일한가를 검정

ex) 성별에 따라 선호하는 과목이 동일하다 / 차이가 있다

 

카이제곱통계량 = ∑(O-E)^2/E ~ 자유도 (행수-1)*(열수-1)

분할표의 각 칸의 기대 도수가 5 이하인 셀 20% 이상이면 사용할 수 없음

-> 카이제곱검정은 대표본에서만 유효한 근사 검정이므로 5 이하인 경우 피셔의 정확 검정 (Fisher's Exact Test)

 

반응형

'Data Science' 카테고리의 다른 글

Claude 3.5 Sonnet 버전 1과 2 비교  (0) 2024.12.27
ANOVA (Analysis of Variance)  (0) 2024.04.22
GA4와 BigQuery 활용 웨비나  (0) 2023.03.09
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/03   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
글 보관함