HOME
home
About
home

Kruskal-Wallis 검정

Kruskal-Wallis 검정의 이해

1. 개요

1.1 기본 개념

Kruskal-Wallis 검정은 세 개 이상의 독립된 집단 간 분포 차이(특히 중위수 중심)를 비교하기 위한 비모수적(non-parametric) 검정 방법입니다.
모수적 검정인 일원분산분석(ANOVA)는 종속변수가 정규분포를 따른다는 가정, 그리고 등분산성 가정 하지만 실제 데이터가 정규성을 만족하지 않거나 극단값(이상치)이 많아 ANOVA의 가정이 깨지면, Kruskal-Wallis 검정을 대안으로 사용할 수 있습니다.
적용 데이터 유형: 순서형(Ordinal) 혹은 연속형(Continuous) 종속변수. 군집(집단)이 명목형 변수로 구성되고, 각 집단이 독립적인 표본이어야 합니다.

1.2 사용 조건

1.
독립 표본: 각 집단 샘플이 서로 겹치지 않아야 함 (예: 서로 다른 사람·집단에 대한 측정).
2.
순서형/연속형 종속변수: 순위를 매길 수 있는 값이면 OK.
3.
정규성 가정이 위배된 경우: 자료가 왜곡되었거나 이상치가 많아 정규분포를 가정하기 어려울 때 유리합니다.
4.
등분산성 가정이 위배된 경우: 집단 간 분산이 크게 달라지는 상황에서도 사용 가능합니다.

2. 수학적 기초

2.1 기본 원리

1.
데이터를 모두 통합하여 순위화
예: A, B, C 세 집단이 있고, 각 집단의 관찰값을 하나의 리스트로 모아 오름차순 정렬 후 순위를 부여합니다.
값이 같을 경우(동률)에는 해당 관측값들이 차지하는 순위의 평균값을 할당합니다(= ‘동률 평균 순위’).
2.
각 집단별 순위 합계 계산
정렬된 전체 관찰값에서 어떤 관찰이 A집단 소속이면, 그 순위를 A집단에 할당하고 이를 모두 합산합니다.
3.
순위 합계를 통해 검정 통계량(H) 계산
Kruskal-Wallis 검정에서 H 통계량은 각 집단의 “평균 순위와 집단 크기”를 종합하여 구합니다.
4.
결과적으로 집단 간 순위(=중앙값 근방의 분포) 차이가 큰 경우, H 값이 커져 귀무가설(집단 간 분포 차이 없음)이 기각될 수 있습니다.

2.2 검정 통계량 (H)

H=12N(N+1)(Ri2ni)    3(N+1)H = \frac{12}{N(N+1)} \sum \left(\frac{R_i^2}{n_i}\right) \;-\; 3(N+1)
NN: 전체 표본 크기(모든 집단 관찰값 수의 합)
RiR_i: i 번째 집단의 순위 합 (rank sum)
ni:n_i: i 번째 집단의 표본 크기
이때, 12N(N+1)\frac{12}{N(N+1)}는 순위 합계의 분포를 표준화해주는 역할을 합니다. 만일 집단 간 차이가 전혀 없어 비슷한 순위를 가진다면 H 값이 작아지고, 차이가 클수록 H가 증가합니다.

2.3 귀무가설과 대립가설

귀무가설(H0H_0): 모든 집단의 분포는 동일하다. 즉, 집단 간 차이가 없다.
대립가설(H1H_1): 적어도 한 집단이 나머지 집단과 다른 분포(또는 중위수)를 가진다.
Kruskal-Wallis 검정이 유의하게 나오면(즉, p-value < 유의수준) “집단 간 적어도 하나는 다르다”는 결론이지만, 어떤 집단이 어떻게 다른지는 추가 사후 검정(post-hoc)을 해야 알 수 있습니다.

3. 검정 절차

3.1 기본 단계

1.
데이터 순위화
예) 모든 집단의 관찰값을 한데 모아 오름차순으로 정렬하고 1등부터 N등까지 순위를 매깁니다.
동률 발생 시, 해당 구간에 대해 동률 평균순위를 각 관찰값에 할당합니다.
2.
집단별 순위 합계(Rᵢ) 계산
각 집단에 속한 데이터가 갖는 순위를 모두 더합니다. 예) A집단의 모든 관찰값에 부여된 순위를 합하면 .
RAR_A
3.
검정 통계량(H) 계산
위 공식에 따라 값을 구합니다.
HH
(동률이 많다면 보정 항(C)을 적용하여 를 조정해야 합니다.)
HH
4.
결과 해석
Kruskal-Wallis 검정 통계량 는 (집단 수 - 1) 자유도를 갖는 카이제곱(χ2\chi^2) 분포에 근사합니다.
귀무가설이 참이라면, 가 큰 값이 나올 확률은 작으므로, p-값이 일정 기준(예: 0.05)보다 작으면 “유의미한 차이”로 판단합니다.

3.2 동률 보정

실제 연구에서 값이 똑같거나 매우 비슷한 관찰값들이 많은 경우, 단순 순위 할당으로는 변동을 제대로 반영하기 어렵습니다.
이런 동률(tie) 문제를 보정하기 위해, 다음처럼 보정 계수 C 를 곱하거나 나누기도 합니다.
Hcorrected=HC또는Hcorrected=H×C(사용자 정의)H_{\text{corrected}} = \frac{H}{C} \quad\text{또는}\quad H_{\text{corrected}} = H \times C' \quad (\text{사용자 정의})
여기서 보정 계수 C는 (교재나 소프트웨어에 따라 다르게 표현되지만) 대표적으로 아래와 같은 식을 포함합니다.
C=1(t3t)N3NC = 1 - \frac{\sum (t^3 - t)}{N^3 - N}
t: 동률 그룹(동일값을 가진 관측값 집합)의 크기
동률이 많으면 많을수록 이 보정 과정을 무시했을 때 검정통계량이나 p-값이 왜곡될 수 있으므로, 반드시 소프트웨어 옵션에서 “동률 보정(tie correction)” 기능을 확인해야 합니다.

4. 사후 분석

4.1 Dunn's Test

Kruskal-Wallis 검정이 유의하다고 나왔을 때, 어떤 집단이 어떻게 다른지 쌍별(pairwise) 비교를 하는 대표적인 비모수적 사후 검정입니다.
집단 A vs B, A vs C, B vs C 등등을 각각 비교하고, 여기서 다중 비교 보정(예: Bonferroni, Holm, FDR 등)을 통해 제1종 오류(거짓 양성)를 통제합니다.
Dunn's Test는 여러 쌍을 비교하되, 데이터 순위 기반으로 효과를 추정하므로 ANOVA에서 Tukey, Bonferroni 등의 사후검정과 유사한 역할을 합니다.

4.2 Mann-Whitney U 검정

두 집단씩 비교하는 또 다른 비모수적 방법으로, Wilcoxon 순위합 검정과 동일한 개념입니다.
세 집단 이상을 비교하려면, Mann-Whitney U를 쌍별로 돌리고 보정(Bonferroni 등)을 적용해야 하지만, 모든 쌍별 비교 시 검정력이 낮아지거나 보정으로 인해 유의성이 떨어질 수 있습니다.
따라서 Kruskal-Wallis → Dunn’s Test 순서가 가장 일반적이지만, 필요에 따라 Mann-Whitney U를 사용하기도 합니다.

5. 해석 및 보고

5.1 기본 정보 포함사항

연구결과를 보고할 때, 다음 정보를 함께 제시해야 결과를 명확하게 해석할 수 있습니다.
1.
표본 크기(nin_i): 각 집단별 몇 명(또는 몇 개 샘플)을 분석했는지.
2.
검정 통계량(H): Kruskal-Wallis H 값(혹은 보정된 )
HcorrectedHcorrectedHcorrectedH_{\text{corrected}}
3.
자유도(df): 집단 수가 k개이면
df=k1ddf=k−1d
4.
p-값: 유의수준(예: 0.05) 대비 결과의 유의성 여부
5.
사후 검정 결과: 유의하다면, 어떤 집단 간 차이가 있는지 쌍별 비교 결과를 첨부.

5.2 시각화 방법

1.
상자 그림(Box Plot): 각 집단별로 데이터의 중앙값, 사분위 범위, 이상치를 시각적으로 보여줌.
2.
바이올린 플롯(Violin Plot): 데이터 분포(커널 밀도)를 포함해 시각적으로 더 풍부한 정보를 제공.
3.
순위 분포 그래프: 집단별로 순위 자체를 보여주거나, 순위합 분포를 시각화하는 방법.
이러한 그래프들은 데이터 분포 형태(편향, 이상치 등)를 파악하는 데에도 유용하므로, Kruskal-Wallis 검정 결과 해석 시 함께 보면 좋습니다.

6. 장단점

6.1 장점

1.
정규성 가정 불필요: 실제 데이터가 정규분포가 아니어도 적용 가능
2.
이상치(outlier)에 강건: 순위를 사용하기 때문에 극단값의 영향이 상대적으로 작음
3.
순서형 데이터에 적합: 점수 대신 서열 자료인 경우에도 적용 가능
4.
등분산성 가정 불필요: 집단별 분산이 달라도 적용 가능

6.2 단점

1.
모수적 방법 대비 검정력(power)이 낮을 수 있음: 정규성이 어느 정도 맞는 경우에는 ANOVA가 더 민감하게 차이를 잡아낼 수 있음
2.
순위 변환으로 인한 정보 손실: 실측값(예: 평균 차이) 대신 순위만 사용하므로, 실제 차이 크기에 대한 정교한 해석이 어려움
3.
‘평균 차이’의 직접적 해석이 어려움: Kruskal-Wallis는 분포(중위수) 차이를 검정하므로, 결과적으로 “집단 간 평균이 ~만큼 차이난다”는 ANOVA식 해석이 어렵다.
4.
표본 크기가 아주 작으면 검정 통계량의 근사성이 낮아 정확도 떨어질 수 있음. 정확 검정(Exact test)을 고려할 수 있음.

7. 실무 적용 시 고려사항

7.1 사용 시점

1.
정규성 가정 위배: 샤피로-윌크, 콜모고로프-스미르노프 등 정규성 테스트에서 실패 시
2.
이상치 많음: 극단값 때문에 평균이 왜곡될 때
3.
순서형 데이터: 주관식 설문응답(예: 만족도 1~5점)을 서열 데이터로 보고 싶을 때
4.
등분산성 가정 위배: Levene's test 등에서 각 집단 분산이 크게 다르다고 판단될 때

7.2 주의사항

1.
독립성 가정: 반복측정 자료나 짝지어진 자료는 다른 검정(Wilcoxon 부호순위검정, Friedman 검정 등) 사용
2.
표본 크기 균형: 너무 편중된 집단 크기는 순위합 비교 시 왜곡 가능
3.
동률 처리: 동률 보정 확인
4.
사후 검정: Kruskal-Wallis가 유의할 시, 어떤 집단 간 차이가 유의한지 Dunn’s Test, Mann-Whitney U + 보정 등을 수행

마무리

Kruskal-Wallis 검정은 “세 개 이상의 집단 간 분포 차이를 비교”할 때, 정규성·등분산성 가정을 만족하지 못하거나, 순서형 자료 등을 다루어야 할 때 사용하기 좋은 비모수적 방법입니다.
1.
순위 기반이라서 극단값이나 가정 위배에 비교적 둔감하지만, 그만큼 검정력이 낮을 수 있다는 점을 고려해야 합니다.
2.
결과가 유의하게 나오면, 어느 집단끼리 차이가 큰지를 사후 검정을 통해 확인해야 합니다.
3.
보고 시에는 H 통계량, 자유도, p-값과 함께, 표본 크기, 순위 합계(또는 평균 순위), 그리고 사후 검정 결과를 제시하면 해석이 명확해집니다.
이러한 특징을 잘 이해하면, 실무나 연구에서 데이터 분포가 균일하지 않거나 이상치가 심한 상황에서도 신뢰도 있는 집단 간 비교를 수행할 수 있습니다.