본문 바로가기
AC-GAN/용어정리

[기본 용어 설명] 베이즈 정리를 통한 사전 확률(Prior)과 사후 확률(Posterior), 우도(Likelihood)

by kkkkk1023 2024. 11. 15.

우선 베이즈 정리를 알기 전 결합 확률(joint prbability)와 조건부 확률(condition probability)에 대해서 알아야한다.
 

결합 확률 - P(x, y)

결합 확률이란 x사건과 y사건이 동시에 일어날 확률을 의미한다.
 
 

조건부 확률 - P(x | y)

조건부 확률이란 y사건이 일어난 후 x사건이 일어날 확률을 의미한다.
 
 

결합 확률과 조건부 확률의 관계 - P(x, y) = P(x| y)P(y)

결합 확률은 조건부 확률과 사건 x가 일어날 확률을 곱한 식으로 나타낼 수 있다. 
 
 


 

베이즈 정리

 
이러한 관계를 이용해서  베이즈 정리를 정의할 수 있다. 일반적으로 P(x, y)와 P(y, x)의 확률이 같기때문에 아래의 식이 성립된다.

 
 
위 식을 P(y|x)에 대해서 정리를 하면 아래와 같이 베이즈 정리가 나온다. 
 

왼쪽) 베이즈 정리 / 오른쪽) 베이즈 정리가 모수 추정을 목적하다는 식

 
 
사건 A를 이 사람이 거짓말을 한 경우이고, 사건 B를 거짓말 탐지기가 거짓말이라고 판정한 경우라고 생각해서 위의 식을 해석해보겠다.
 

 
즉, 거짓말 탐지기가 거짓말이라고 판정했을 때 이 사람이 거짓말을 할 확률에 대한 식이다. 하지만 이렇게 매번 거짓말 탐지기 결과에 따라서 거짓말인지 아닌지를 계산하기는 어렵다. 따라서, 우리가 알 수 있는 정보들을 계산해서 원하는 확률을 구할 수 있다.
 
그래서 우도와 사전 확률을 곱한 값에 evidence(결과가 발생할 전체 확률)를 나눈 값을 통해서 사후 확률 값을 구할 수 있다. 
 
 

우도

우도라는 것은  사전 확률 P(A|B)가 있을 때 P(B|A)를 의미하는 것이다. 즉, A가 발생한 후 B가 일어날 확률이다. 
 

사전 확률

사전 확률이라는 것은 새로운 관찰이 이루어지기 전에 미리 가지고 있는 기존 정보에 기반한 확률을 의미한다.
위의식을 바탕으로 하면 이 사람이 거짓말을 평소에 하는 확률을 의미한다. 
 

사후 확률 

사후 확률이라는 것은 새로운 관찰의 결과를 반영한 후 (B), 사건 A가 일어날 확률을 의미한다. 
즉, 거짓말 탐지기가 거짓말이라고 판정했을 때 이 사람이 거짓말을 할 확률을 의미한다.
 
 

질병을 예를 들어 사전 확률과 사후 확률 설명하기

예를 들어 A라는 병이 있고 어떤 환자가 이 병이 의심되어 병원에서 검사를 한다고 가정했을 떄, 병을 검사하기 전에 이 병이 얼마나 걸리기 어려운지, 쉬운지에 따라 병이 걸릴 확률을 확인하는 것을 "사전 확률"이라고 하고, 병을 검사하고 양성 결과를 반영해 실제로 병에 걸렸을 가능성을 "사후 확률"이라고 한다. 
 
 


 
 

모수 추정으로 표현한 사후 확률과 우도

θ와 x의 의미

θ는 확률 분포를 구성하는 Parameter를 의미(쉽게 말해서, 확률 분포를 결정하는 변수)하고, x는 관측값(데이터 또는 사건)을 의미한다.
 


모수 추정에서의 우도, 사전 확률, 사후 확률의 의미

우도는 θ(매개변수)로 분포를 구성할 때, x(데이터)가 나올 확률을 말하고, 사전 확률은 관찰하기 전 θ(매개변수)에 대해 가지고 있는 초기 지식을 의미하고, 사후 확률은 사전확률과 우도를 결합해서 데이터에 맞게 갱신된 θ(매개변수)에 대한 확률을 의미한다.