Kruskal-Wallis 검정의 이해
1. 개요
1.1 기본 개념
•
Kruskal-Wallis 검정은 세 개 이상의 독립된 집단 간 분포 차이(특히 중위수 중심)를 비교하기 위한 비모수적(non-parametric) 검정 방법입니다.
•
모수적 검정인 일원분산분석(ANOVA)는 종속변수가 정규분포를 따른다는 가정, 그리고 등분산성 가정
하지만 실제 데이터가 정규성을 만족하지 않거나 극단값(이상치)이 많아 ANOVA의 가정이 깨지면, Kruskal-Wallis 검정을 대안으로 사용할 수 있습니다.
•
적용 데이터 유형: 순서형(Ordinal) 혹은 연속형(Continuous) 종속변수. 군집(집단)이 명목형 변수로 구성되고, 각 집단이 독립적인 표본이어야 합니다.
1.2 사용 조건
1.
독립 표본: 각 집단 샘플이 서로 겹치지 않아야 함 (예: 서로 다른 사람·집단에 대한 측정).
2.
순서형/연속형 종속변수: 순위를 매길 수 있는 값이면 OK.
3.
정규성 가정이 위배된 경우: 자료가 왜곡되었거나 이상치가 많아 정규분포를 가정하기 어려울 때 유리합니다.
4.
등분산성 가정이 위배된 경우: 집단 간 분산이 크게 달라지는 상황에서도 사용 가능합니다.
2. 수학적 기초
2.1 기본 원리
1.
데이터를 모두 통합하여 순위화
•
예: A, B, C 세 집단이 있고, 각 집단의 관찰값을 하나의 리스트로 모아 오름차순 정렬 후 순위를 부여합니다.
•
값이 같을 경우(동률)에는 해당 관측값들이 차지하는 순위의 평균값을 할당합니다(= ‘동률 평균 순위’).
2.
각 집단별 순위 합계 계산
•
정렬된 전체 관찰값에서 어떤 관찰이 A집단 소속이면, 그 순위를 A집단에 할당하고 이를 모두 합산합니다.
3.
순위 합계를 통해 검정 통계량(H) 계산
•
Kruskal-Wallis 검정에서 H 통계량은 각 집단의 “평균 순위와 집단 크기”를 종합하여 구합니다.
4.
결과적으로 집단 간 순위(=중앙값 근방의 분포) 차이가 큰 경우, H 값이 커져 귀무가설(집단 간 분포 차이 없음)이 기각될 수 있습니다.
2.2 검정 통계량 (H)
•
: 전체 표본 크기(모든 집단 관찰값 수의 합)
•
: i 번째 집단의 순위 합 (rank sum)
•
i 번째 집단의 표본 크기
이때, 는 순위 합계의 분포를 표준화해주는 역할을 합니다.
만일 집단 간 차이가 전혀 없어 비슷한 순위를 가진다면 H 값이 작아지고, 차이가 클수록 H가 증가합니다.
2.3 귀무가설과 대립가설
•
귀무가설(): 모든 집단의 분포는 동일하다. 즉, 집단 간 차이가 없다.
•
대립가설(): 적어도 한 집단이 나머지 집단과 다른 분포(또는 중위수)를 가진다.
Kruskal-Wallis 검정이 유의하게 나오면(즉, p-value < 유의수준) “집단 간 적어도 하나는 다르다”는 결론이지만, 어떤 집단이 어떻게 다른지는 추가 사후 검정(post-hoc)을 해야 알 수 있습니다.
3. 검정 절차
3.1 기본 단계
1.
데이터 순위화
•
예) 모든 집단의 관찰값을 한데 모아 오름차순으로 정렬하고 1등부터 N등까지 순위를 매깁니다.
•
동률 발생 시, 해당 구간에 대해 동률 평균순위를 각 관찰값에 할당합니다.
2.
집단별 순위 합계(Rᵢ) 계산
•
각 집단에 속한 데이터가 갖는 순위를 모두 더합니다. 예) A집단의 모든 관찰값에 부여된 순위를 합하면 .
3.
검정 통계량(H) 계산
•
위 공식에 따라 값을 구합니다.
•
(동률이 많다면 보정 항(C)을 적용하여 를 조정해야 합니다.)
4.
결과 해석
•
Kruskal-Wallis 검정 통계량 는 (집단 수 - 1) 자유도를 갖는 카이제곱() 분포에 근사합니다.
•
귀무가설이 참이라면, 가 큰 값이 나올 확률은 작으므로, p-값이 일정 기준(예: 0.05)보다 작으면 “유의미한 차이”로 판단합니다.
3.2 동률 보정
•
실제 연구에서 값이 똑같거나 매우 비슷한 관찰값들이 많은 경우, 단순 순위 할당으로는 변동을 제대로 반영하기 어렵습니다.
•
이런 동률(tie) 문제를 보정하기 위해, 다음처럼 보정 계수 C 를 곱하거나 나누기도 합니다.
•
여기서 보정 계수 C는 (교재나 소프트웨어에 따라 다르게 표현되지만) 대표적으로 아래와 같은 식을 포함합니다.
•
t: 동률 그룹(동일값을 가진 관측값 집합)의 크기
동률이 많으면 많을수록 이 보정 과정을 무시했을 때 검정통계량이나 p-값이 왜곡될 수 있으므로, 반드시 소프트웨어 옵션에서 “동률 보정(tie correction)” 기능을 확인해야 합니다.
4. 사후 분석
4.1 Dunn's Test
•
Kruskal-Wallis 검정이 유의하다고 나왔을 때, 어떤 집단이 어떻게 다른지 쌍별(pairwise) 비교를 하는 대표적인 비모수적 사후 검정입니다.
•
집단 A vs B, A vs C, B vs C 등등을 각각 비교하고, 여기서 다중 비교 보정(예: Bonferroni, Holm, FDR 등)을 통해 제1종 오류(거짓 양성)를 통제합니다.
•
Dunn's Test는 여러 쌍을 비교하되, 데이터 순위 기반으로 효과를 추정하므로 ANOVA에서 Tukey, Bonferroni 등의 사후검정과 유사한 역할을 합니다.
4.2 Mann-Whitney U 검정
•
두 집단씩 비교하는 또 다른 비모수적 방법으로, Wilcoxon 순위합 검정과 동일한 개념입니다.
•
세 집단 이상을 비교하려면, Mann-Whitney U를 쌍별로 돌리고 보정(Bonferroni 등)을 적용해야 하지만, 모든 쌍별 비교 시 검정력이 낮아지거나 보정으로 인해 유의성이 떨어질 수 있습니다.
•
따라서 Kruskal-Wallis → Dunn’s Test 순서가 가장 일반적이지만, 필요에 따라 Mann-Whitney U를 사용하기도 합니다.
5. 해석 및 보고
5.1 기본 정보 포함사항
연구결과를 보고할 때, 다음 정보를 함께 제시해야 결과를 명확하게 해석할 수 있습니다.
1.
표본 크기(nin_i): 각 집단별 몇 명(또는 몇 개 샘플)을 분석했는지.
2.
검정 통계량(H): Kruskal-Wallis H 값(혹은 보정된 )
3.
자유도(df): 집단 수가 k개이면
4.
p-값: 유의수준(예: 0.05) 대비 결과의 유의성 여부
5.
사후 검정 결과: 유의하다면, 어떤 집단 간 차이가 있는지 쌍별 비교 결과를 첨부.
5.2 시각화 방법
1.
상자 그림(Box Plot): 각 집단별로 데이터의 중앙값, 사분위 범위, 이상치를 시각적으로 보여줌.
2.
바이올린 플롯(Violin Plot): 데이터 분포(커널 밀도)를 포함해 시각적으로 더 풍부한 정보를 제공.
3.
순위 분포 그래프: 집단별로 순위 자체를 보여주거나, 순위합 분포를 시각화하는 방법.
이러한 그래프들은 데이터 분포 형태(편향, 이상치 등)를 파악하는 데에도 유용하므로, Kruskal-Wallis 검정 결과 해석 시 함께 보면 좋습니다.
6. 장단점
6.1 장점
1.
정규성 가정 불필요: 실제 데이터가 정규분포가 아니어도 적용 가능
2.
이상치(outlier)에 강건: 순위를 사용하기 때문에 극단값의 영향이 상대적으로 작음
3.
순서형 데이터에 적합: 점수 대신 서열 자료인 경우에도 적용 가능
4.
등분산성 가정 불필요: 집단별 분산이 달라도 적용 가능
6.2 단점
1.
모수적 방법 대비 검정력(power)이 낮을 수 있음: 정규성이 어느 정도 맞는 경우에는 ANOVA가 더 민감하게 차이를 잡아낼 수 있음
2.
순위 변환으로 인한 정보 손실: 실측값(예: 평균 차이) 대신 순위만 사용하므로, 실제 차이 크기에 대한 정교한 해석이 어려움
3.
‘평균 차이’의 직접적 해석이 어려움: Kruskal-Wallis는 분포(중위수) 차이를 검정하므로, 결과적으로 “집단 간 평균이 ~만큼 차이난다”는 ANOVA식 해석이 어렵다.
4.
표본 크기가 아주 작으면 검정 통계량의 근사성이 낮아 정확도 떨어질 수 있음. 정확 검정(Exact test)을 고려할 수 있음.
7. 실무 적용 시 고려사항
7.1 사용 시점
1.
정규성 가정 위배: 샤피로-윌크, 콜모고로프-스미르노프 등 정규성 테스트에서 실패 시
2.
이상치 많음: 극단값 때문에 평균이 왜곡될 때
3.
순서형 데이터: 주관식 설문응답(예: 만족도 1~5점)을 서열 데이터로 보고 싶을 때
4.
등분산성 가정 위배: Levene's test 등에서 각 집단 분산이 크게 다르다고 판단될 때
7.2 주의사항
1.
독립성 가정: 반복측정 자료나 짝지어진 자료는 다른 검정(Wilcoxon 부호순위검정, Friedman 검정 등) 사용
2.
표본 크기 균형: 너무 편중된 집단 크기는 순위합 비교 시 왜곡 가능
3.
동률 처리: 동률 보정 확인
4.
사후 검정: Kruskal-Wallis가 유의할 시, 어떤 집단 간 차이가 유의한지 Dunn’s Test, Mann-Whitney U + 보정 등을 수행
마무리
Kruskal-Wallis 검정은 “세 개 이상의 집단 간 분포 차이를 비교”할 때, 정규성·등분산성 가정을 만족하지 못하거나, 순서형 자료 등을 다루어야 할 때 사용하기 좋은 비모수적 방법입니다.
1.
순위 기반이라서 극단값이나 가정 위배에 비교적 둔감하지만, 그만큼 검정력이 낮을 수 있다는 점을 고려해야 합니다.
2.
결과가 유의하게 나오면, 어느 집단끼리 차이가 큰지를 사후 검정을 통해 확인해야 합니다.
3.
보고 시에는 H 통계량, 자유도, p-값과 함께, 표본 크기, 순위 합계(또는 평균 순위), 그리고 사후 검정 결과를 제시하면 해석이 명확해집니다.
이러한 특징을 잘 이해하면, 실무나 연구에서 데이터 분포가 균일하지 않거나 이상치가 심한 상황에서도 신뢰도 있는 집단 간 비교를 수행할 수 있습니다.