Discriminative model vs Generative model

Remarks

이 글은 Computer Vision: Models, Learning, and Inference를 참고하여 작성되었습니다.

Discriminative model: Modeling $Pr(Y \mid X)$
Generative model: Modeling $Pr(X \mid Y)$

Data로부터 target의 확률(분포)를 추론하는 경우 크게 3가지 요소가 필요합니다.

Model
Data(Input) $X$와 Target(Output) $Y$ 간의 관계를 수학적으로 나타내는 것으로, Parameter $\theta$에 의해 결정될 수 있습니다.
Learning algorithm
Training data $X_{1..N}, Y_{1..N}$으로부터 Parameter $\theta$를 학습시키는 알고리즘
1) MLE (Maximum Likelihood Estimator)
$ \hat{\theta} = argmax_\theta Pr(Y_{1..N} \mid X_{1..N}, \theta) = argmax_\theta \Pi_{i=1}^N Pr(Y_i \mid X_i, \theta) = argmax_\theta \Sigma_{i=1}^N logPr(Y_i \mid X_i, \theta) \text{ with independence assumption} $
2) MAP (Maximum A Posterior)
$ \hat{\theta} = argmax_\theta Pr(\theta \mid X_{1..N}, Y_{1..N}) = argmax_\theta \Pi_{i=1}^N Pr(Y_i \mid X_i, \theta)Pr(\theta) \text{ with independence assumption} $
Inference algorithm
Model을 사용하여 new data $x^\ast$에 대한 output의 확률분포 $Pr(Y|X=x^\ast)$를 추정하는 알고리즘

무엇을 modeling하는지에 따라 2가지로 나누어볼 수 있습니다.

Discriminative Model
Model on the data $Pr(Y|X)$
- Data가 주어진 경우에만 작동시킬 수 있습니다.
Generative Model
Model on the target $Pr(X|Y)$
- Data가 주어지지 않고 target만 주어진 경우, data를 생성할 수 있습니다.

	Discriminative model	Generative model
Model	$Pr(Y \mid X)$	$Pr(X \mid Y)$
Learning algorithm	Learn $\theta$ from training data	Learn $\theta$ from training data
Inference algorithm	Evaluate model $Pr(Y \mid X=x^\ast)$	1. Define prior $Pr(Y)$ 2. $Pr(Y \mid X=x^\ast)=\frac{Pr(X=x^\ast \mid Y) Pr(Y)}{\int Pr(X=x^\ast \mid Y) Pr(Y) dY}$

	Discriminative model	Generative model
Model	$Pr(Y \mid X)$	$Pr(X \mid Y)$
Regression	Linear regression	Linear regression
Binary classification	Logistic regression	Probability density function

PREVIOUSEtc