HOME
home
About
home

베이지안 추론이란?

베이지안 추론(Bayesian inference)은 관측된 데이터와 기존의 사전 지식을 결합해, 불확실한 상황에서 확률적으로 추정과 의사결정을 내리는 통계적 방법론입니다51. 이 방법은 관측 이전의 믿음(사전 확률, prior)과 관측된 데이터(우도, likelihood)를 바탕으로, 관측 후의 믿음(사후 확률, posterior)을 계산하는 과정을 포함합니다.

베이지안 추론의 핵심 원리

베이즈 정리(Bayes’ theorem)에 기반합니다.
P(AB)=P(B)P(BA)P(A)P(A∣B)=P(B)P(B∣A)⋅P(A)
베이즈 정리는 다음과 같이 표현됩니다.
P(AB)=P(BA)P(A)P(B)P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
여기서
P(AB)P(A∣B) : 데이터 B가 관측된 후 사건 A의 확률(사후 확률)
P(BA)P(BA)P(BA)P(B∣A)P(B|A)P(B∣A) : 사건 A가 주어졌을 때 데이터 B가 나올 확률(우도)
P(A)P(A) : 사건 A에 대한 사전 확률
P(B)P(B) : 데이터 B의 전체 확률
사전 분포(prior distribution):
데이터를 관측하기 전, 추정 대상(예: 모수, 사건)에 대해 우리가 갖고 있는 기존 지식이나 믿음을 확률로 표현합니다35.
우도 함수(likelihood):
주어진 파라미터(혹은 가설) 하에서 실제 데이터가 관측될 확률을 나타냅니다35.
사후 분포(posterior distribution):
관측된 데이터를 반영해, 사전 분포와 우도 함수를 결합하여 업데이트된 확률 분포입니다. 즉, 데이터가 주어졌을 때 추정 대상이 가질 확률분포입니다351.

베이지안 추론의 특징과 장점

정보의 갱신:
새로운 데이터가 들어올 때마다 사후 확률이 다시 사전 확률이 되어, 정보가 지속적으로 갱신됩니다25.
불확실성의 정량화:
추정 대상의 불확실성을 확률분포로 표현할 수 있습니다.
적은 데이터에도 강인함:
데이터가 적거나 반복 실험이 어려운 상황에서도 사전 지식을 활용해 추론이 가능합니다64.
모델의 유연성:
다양한 사전 지식과 복잡한 모델 구조를 쉽게 반영할 수 있습니다5.

예시

의료 진단:
예를 들어, 암 검사의 양성 결과가 나왔을 때 실제로 암에 걸렸을 확률을 계산할 때, 전체 인구에서의 암 발병률(사전 확률)과 검사 정확도(우도)를 결합해 사후 확률을 구합니다4.

요약

베이지안 추론은
"관측 전의 믿음(사전 확률)"과
"관측된 데이터(우도)"를
"관측 후의 믿음(사후 확률)"으로 갱신하는 확률적 추론 체계입니다135.
이 방식은 머신러닝, 예측 모델링, 의사결정 등 다양한 분야에서 활용되며, 데이터가 추가될 때마다 모델을 동적으로 업데이트할 수 있다는 장점이 있습니다5.
무슨말인지, 이해하기 어렵죠? 예시를 들어봅시다.

베이지안 추론의 쉬운 이해를 위한 예시

베이지안 추론은 새로운 증거가 주어졌을 때 기존 믿음(사전 확률)을 업데이트하는 방법입니다. 일상생활에서 쉽게 이해할 수 있는 예시로 설명해 드리겠습니다.

의사의 진단 예시

의사가 특정 질병을 진단하는 상황을 생각해 봅시다:
1.
사전 확률(Prior): 일반 인구에서 이 질병의 발병률이 1%라고 합니다. 즉, 무작위로 선택된 사람이 이 질병을 가질 확률은 1%입니다.
2.
가능도(Likelihood): 이 질병을 진단하는 검사가 있습니다.
질병이 있는 사람을 검사하면 90%의 확률로 양성 결과가 나옵니다(민감도).
질병이 없는 사람을 검사하면 80%의 확률로 음성 결과가 나옵니다(특이도).
3.
새로운 증거: 환자가 검사를 받았고 양성 결과가 나왔습니다.
4.
사후 확률(Posterior): 검사 결과가 양성인 상황에서, 이 환자가 실제로 질병을 가지고 있을 확률은 얼마일까요?
베이지안 추론을 통해 계산하면:
P(질병|양성) = [P(양성|질병) × P(질병)] ÷ P(양성) P(양성) = P(양성|질병) × P(질병) + P(양성|질병 없음) × P(질병 없음) = 0.9 × 0.01 + 0.2 × 0.99 = 0.009 + 0.198 = 0.207 따라서, P(질병|양성) = (0.9 × 0.01) ÷ 0.207 = 0.009 ÷ 0.207 ≈ 0.043 = 4.3%
Plain Text
복사
즉, 검사 결과가 양성이라 해도 실제로 질병을 가질 확률은 약 4.3%에 불과합니다. 이것이 베이지안 추론의 중요한 통찰입니다 - 검사 결과만 보고 단순히 '이 사람은 질병이 있다'고 결론내리면 안 되며, 사전 확률(질병의 희귀성)을 반드시 고려해야 합니다.

일상 생활의 예시: 비 예측

매일 아침 출근 전 비가 올지 판단하는 상황을 생각해 봅시다:
1.
사전 확률: 5월 인천 지역에서 비가 올 확률이 30%라고 가정합니다.
2.
가능도: 당신은 하늘을 보니 구름이 많이 끼어 있습니다. 경험상:
비가 올 날에는 80%의 확률로 구름이 많이 끼어 있습니다.
비가 오지 않는 날에는 40%의 확률로 구름이 많이 끼어 있습니다.
3.
새로운 증거: 오늘 아침 하늘에 구름이 많이 끼어 있습니다.
4.
사후 확률: 구름이 많이 낀 상황에서, 오늘 비가 올 확률은 얼마일까요?
베이지안 추론을 통해 계산하면:
P(비|구름) = [P(구름|비) × P(비)] ÷ P(구름) P(구름) = P(구름|비) × P(비) + P(구름|비 안옴) × P(비 안옴) = 0.8 × 0.3 + 0.4 × 0.7 = 0.24 + 0.28 = 0.52 따라서, P(비|구름) = (0.8 × 0.3) ÷ 0.52 = 0.24 ÷ 0.52 ≈ 0.46 = 46%
Plain Text
복사
구름이 많이 끼었다는 새로운 증거를 고려했을 때, 비가 올 확률이 30%에서 46%로 증가했습니다. 이것이 증거를 바탕으로 믿음을 업데이트하는 베이지안 추론의 핵심입니다.
베이지안 추론은 이처럼 불확실성 속에서 합리적인 의사결정을 내리는 데 도움이 되는 강력한 도구입니다. 새로운 정보가 들어올 때마다 기존의 믿음을 조정하여 더 정확한 판단을 내릴 수 있게 해줍니다.

Citations: