베이지안 업데이팅이란?, 수학이 알려주는 유연한 사고

믿음은 단단한 신념이 아니라, 변화하는 세상 속에서 조율되어야 할 가설이다. 베이지안 업데이팅은 우리가 불확실한 정보를 마주할 때, 믿음을 어떻게 바꿔야 할지를 수학적으로 알려주는 방법이다.

1. 베이지안 업데이팅이란 무엇인가?

베이지안 업데이팅은 새로운 정보를 얻었을 때, 기존의 믿음을 어떻게 수정해야 할지를 알려주는 수학적 방법이다. 이 개념은 18세기 수학자 토머스 베이즈(Thomas Bayes)의 이름에서 유래했으며, 불확실한 상황에서 판단을 내릴 때 사용하는 확률적 사고의 핵심 도구다.

우리는 일상에서 어떤 사안에 대해 미리 가지고 있던 ‘생각’이나 ‘추정’을 갖고 살아간다. 이때 어떤 새로운 정보가 들어오면, 우리는 그 정보를 반영해 기존의 생각을 업데이트하게 되는데, 이 과정을 체계적으로 수치화한 것이 바로 베이지안 업데이팅이다.

2. 수학 모델

베이지안 업데이팅의 핵심은 아래와 같은 베이즈 정리(Bayes’ Theorem)다.

베이즈-정리

여기서 각 요소는 다음과 같다:

  1. P(H|D)-사후 확률 (Posterior): 데이터 D를 관측한 후, 가설 H가 참일 확률
  2. P(H)-사전 확률 (Prior): 데이터 이전에 H가 참일 것으로 생각한 초기 믿음
  3. P(D|H)-가능도 (Likelihood): 가설 H가 참일 때, 데이터 D를 관측할 확률
  4. P(D)-증거의 확률 (Evidence 또는 Normalizing Constant): 데이터 D가 어떤 이유에서든 관측될 전체 확률

2.1. 계산 예시: 질병 진단

질병 A에 대해 다음과 같은 정보가 있다고 가정해보자.

  • 이 질병의 사전 확률: 1% (즉, 인구의 1%만 이 병을 앓고 있음)
  • 검사의 민감도: 99% (병이 있을 때 양성일 확률)
  • 검사의 위양률: 5% (병이 없는데도 양성이 나올 확률)

어떤 사람이 양성 판정을 받았을 때, 그 사람이 실제로 병에 걸렸을 확률은 몇 퍼센트일까?

  • H: 병에 걸린 경우
  • D: 검사 결과 양성

사전 확률은 다음과 같다:

사전-확률

가능도는 다음과 같다:

가능도

증거의 전체 확률은 다음과 같다:

증거의-전체-확률(1)
증거의-전체-확률(2)
증거의-전체-확률(3)

사후 확률은 다음과 같다:

사후-확률

즉, 양성 판정을 받았다고 해서 실제로 병이 있을 확률은 약 16.7%다. 이는 사전 확률이 매우 낮으므로, 검사의 정확도가 높아도 ‘거짓 양성’의 가능성이 높다는 사실을 보여준다.

2.2. 계산 예시: 기상 예보

오늘 아침, 비가 올 확률을 30%로 추정하고 있었다. 그런데 ‘폭우주의보’라는 뉴스를 들었다. 이때 우리는 이렇게 생각할 수 있다:

  • 사전 확률: 비가 올 가능성 30%
  • 새로운 증거: 폭우주의보 → 평소에 비 오는 날 80%에서 발령됨
  • 비가 안 오는 날에 발령될 확률은 10%

그렇다면 다음과 같이 계산할 수 있다:

기상-예보-계산(1)
기상-예보-계산(2)

기상 예보 계산3

따라서, 폭우주의보가 나온 뒤 비가 올 확률은 약 77.4%로 증가하게 된다. 베이지안 업데이팅은 이처럼 새로운 정보가 있을 때 확률을 ‘정량적으로’ 조정할 수 있도록 도와준다.

3. 응용 사례

3.1. 심리학

아이들은 단어를 배울 때 맥락을 이용한다. 예를 들어 누군가 ‘고블럭’이라는 단어를 사용하며 낯선 장난감을 가리켰다면, 아이는 ‘고블럭 = 장난감’일 가능성이 높다고 추정한다. 하지만 다른 문장에서 ‘고블럭’을 사람이나 행동과 연결 짓는다면, 추정은 달라질 수 있다.

이처럼 인간의 언어 학습과 개념 형성 과정은, 기존 믿음을 새로운 정보로 수정하는 베이지안 방식과 유사하다. 현대 인지심리학은 이러한 과정을 ‘확률적 추론’ 모델로 설명한다.

3.2. 인공지능·머신러닝

스팸 메일 필터를 예로 들어보자. 시스템은 ‘Free’라는 단어가 들어간 메일이 얼마나 자주 스팸이었는지를 학습하고, 나중에 비슷한 단어 조합이 보이면 ‘스팸일 가능성’을 계산한다. 이때 각 단어가 스팸 여부에 얼마나 영향을 주는지 계산할 때, 베이지안 확률이 핵심 역할을 한다.

이 방법은 베이지안 필터(Bayesian Filter)라고 불리며, 많은 이메일 서비스에서 기본적으로 채택하고 있는 기술이다.

3.3. 경제학과 투자 판단

한 투자자가 특정 기업의 실적을 예상하고 주식을 매수했다고 가정하자. 이후 분기 실적이 발표되었는데, 예상을 훨씬 웃도는 수준이었다. 이 경우 투자자는 그 기업의 성장 가능성에 대한 기존 믿음을 상향 조정할 수 있다. 반대로 실적이 나쁘다면, 기존의 기대치를 낮춰야 한다.

이러한 ‘기대치의 조정’은 명확히 베이지안 방식의 추론이다. 투자라는 불확실한 환경에서는, 끊임없이 새로운 정보를 반영해 믿음을 수정하는 사고가 중요하다.

3.4. 법학과 범죄 수사

법정에서 새로운 증거가 등장할 때마다, 피고인의 유죄 확률은 조정된다. 지문이 발견되었는지, 목격자가 있었는지, 알리바이가 있는지—이 모든 정보는 기존의 추정에 영향을 주며, 이 변화는 베이지안 추론의 구조를 따른다.

일부 연구에서는 배심원 제도에서도 사람이 암묵적으로 베이지안 추론을 한다고 분석하기도 한다. 다만, 그 계산이 직관적 추정에 의존하기 때문에 편향이 끼어들 수 있다는 점도 함께 지적된다.

4. 주의 사항

베이지안 사고는 강력한 도구지만, 주의해야 할 점도 있다. 이는 다음과 같다:

  1. 사전 확률은 주관적일 수 있다: 누군가는 사전 확률을 30%로 보고, 다른 누군가는 50%로 추정할 수 있다. 이처럼 초기 추정에 따라 결과가 많이 달라지기 때문에, 사전 정보가 부정확하면 잘못된 결론으로 이어질 수 있다.
  2. 계산이 복잡하다: 베이즈 정리는 간단해 보이지만, 실제 적용에서는 조건부 확률, 다양한 사건 간 독립성 여부 등을 정확히 알아야 하므로 실전에서는 계산이 어렵다.
  3. 과신의 위험: 사전 확률이 지나치게 강할 경우, 강력한 증거가 들어와도 결론이 잘 바뀌지 않는다는 문제가 생긴다. 즉, 편견을 강화하는 도구로도 쓰일 수 있다는 점이다.

5. 관점의 변화

베이지안 업데이팅은 단지 확률 계산의 도구가 아니라, 우리가 세상을 유연하게 받아들이는 사고방식이다. 판단이란 항상 임시적인 것이며, 새로운 정보를 반영해 끊임없이 조정해야 한다. 이것은 투자, 의사결정, 인간관계, 정책 등 거의 모든 분야에서 통하는 통찰이다.

우리는 더 많이 알고, 더 정교하게 예측하려 하기보다는, 상황에 따라 믿음을 조율하고 유연하게 대처하는 것이 더 중요할지도 모른다. 베이지안 업데이팅은 그런 현실적인 지혜를 수학이라는 언어로 표현한 도구다.

같이 보면 좋은 글
정규 분포를 배워야 하는 이유, 다양한 예시와 한계점
두꺼운 꼬리란 무엇인가?, 평균이 놓친 세계의 구조
합금의 원리로 생각을 확장하다
던바의 수가 알려주는 관계의 본질

댓글 남기기

error: Content is protected !!