베이지안 추론의 핵심 원리
•
베이즈 정리(Bayes’ theorem)에 기반합니다.
베이즈 정리는 다음과 같이 표현됩니다.
여기서
•
: 데이터 B가 관측된 후 사건 A의 확률(사후 확률)
•
: 사건 A가 주어졌을 때 데이터 B가 나올 확률(우도)
•
: 사건 A에 대한 사전 확률
•
: 데이터 B의 전체 확률
베이지안 추론의 특징과 장점
•
불확실성의 정량화:
추정 대상의 불확실성을 확률분포로 표현할 수 있습니다.
•
모델의 유연성:
예시
•
의료 진단:
예를 들어, 암 검사의 양성 결과가 나왔을 때 실제로 암에 걸렸을 확률을 계산할 때, 전체 인구에서의 암 발병률(사전 확률)과 검사 정확도(우도)를 결합해 사후 확률을 구합니다4.
요약
베이지안 추론은
•
"관측 전의 믿음(사전 확률)"과
•
"관측된 데이터(우도)"를
무슨말인지, 이해하기 어렵죠? 예시를 들어봅시다.
베이지안 추론의 쉬운 이해를 위한 예시
베이지안 추론은 새로운 증거가 주어졌을 때 기존 믿음(사전 확률)을 업데이트하는 방법입니다. 일상생활에서 쉽게 이해할 수 있는 예시로 설명해 드리겠습니다.
의사의 진단 예시
의사가 특정 질병을 진단하는 상황을 생각해 봅시다:
1.
사전 확률(Prior): 일반 인구에서 이 질병의 발병률이 1%라고 합니다. 즉, 무작위로 선택된 사람이 이 질병을 가질 확률은 1%입니다.
2.
가능도(Likelihood): 이 질병을 진단하는 검사가 있습니다.
•
질병이 있는 사람을 검사하면 90%의 확률로 양성 결과가 나옵니다(민감도).
•
질병이 없는 사람을 검사하면 80%의 확률로 음성 결과가 나옵니다(특이도).
3.
새로운 증거: 환자가 검사를 받았고 양성 결과가 나왔습니다.
4.
사후 확률(Posterior): 검사 결과가 양성인 상황에서, 이 환자가 실제로 질병을 가지고 있을 확률은 얼마일까요?
베이지안 추론을 통해 계산하면:
P(질병|양성) = [P(양성|질병) × P(질병)] ÷ P(양성)
P(양성) = P(양성|질병) × P(질병) + P(양성|질병 없음) × P(질병 없음)
= 0.9 × 0.01 + 0.2 × 0.99 = 0.009 + 0.198 = 0.207
따라서, P(질병|양성) = (0.9 × 0.01) ÷ 0.207 = 0.009 ÷ 0.207 ≈ 0.043 = 4.3%
Plain Text
복사
즉, 검사 결과가 양성이라 해도 실제로 질병을 가질 확률은 약 4.3%에 불과합니다. 이것이 베이지안 추론의 중요한 통찰입니다 - 검사 결과만 보고 단순히 '이 사람은 질병이 있다'고 결론내리면 안 되며, 사전 확률(질병의 희귀성)을 반드시 고려해야 합니다.
일상 생활의 예시: 비 예측
매일 아침 출근 전 비가 올지 판단하는 상황을 생각해 봅시다:
1.
사전 확률: 5월 인천 지역에서 비가 올 확률이 30%라고 가정합니다.
2.
가능도: 당신은 하늘을 보니 구름이 많이 끼어 있습니다. 경험상:
•
비가 올 날에는 80%의 확률로 구름이 많이 끼어 있습니다.
•
비가 오지 않는 날에는 40%의 확률로 구름이 많이 끼어 있습니다.
3.
새로운 증거: 오늘 아침 하늘에 구름이 많이 끼어 있습니다.
4.
사후 확률: 구름이 많이 낀 상황에서, 오늘 비가 올 확률은 얼마일까요?
베이지안 추론을 통해 계산하면:
P(비|구름) = [P(구름|비) × P(비)] ÷ P(구름)
P(구름) = P(구름|비) × P(비) + P(구름|비 안옴) × P(비 안옴)
= 0.8 × 0.3 + 0.4 × 0.7 = 0.24 + 0.28 = 0.52
따라서, P(비|구름) = (0.8 × 0.3) ÷ 0.52 = 0.24 ÷ 0.52 ≈ 0.46 = 46%
Plain Text
복사
구름이 많이 끼었다는 새로운 증거를 고려했을 때, 비가 올 확률이 30%에서 46%로 증가했습니다. 이것이 증거를 바탕으로 믿음을 업데이트하는 베이지안 추론의 핵심입니다.
베이지안 추론은 이처럼 불확실성 속에서 합리적인 의사결정을 내리는 데 도움이 되는 강력한 도구입니다. 새로운 정보가 들어올 때마다 기존의 믿음을 조정하여 더 정확한 판단을 내릴 수 있게 해줍니다.