Home

Ensemble learning

Ensemble 일련의 예측기로부터 예측을 수집하면 가장 좋은 한 가지 모델보다 더 좋은 예측을 얻을 수 있습니다. 일련의 예측기를 ensemble이라고 부르고, 이러한 방식으로 학습하는 것을 ensemble learning, ensemble learning algorithm을 ensemble method라고 부릅니다.

Read more

Estimation

Statistical inference (통계적 추론): 주어진 자료를 이용하여 모집단의 특성을 결정지어주는 모수(parameter) $\theta$에 대한 정보를 이끌어내는 것. 크게 추정(estimation)과 가설검정(hypothesis testing)으로 분류된다. Estimation (추정): 표본을 이용하여 모집단의 미지의 모수를 예측하는 과정 Estimator (추정량): 모수 $\theta$를 하나의 값으로 추측하는 통계량(statistic) $\hat \theta(X_1, \cdots, X_n)$ (확률변수) Estimate (추정값, 추정치): 표본(sample)을 이용하여 구한 estima...

Read more

Ridge, Lasso regression, Elastic net

Ridge regression (Tikhonov regularization): cost funtion에 l2 regularization ($\alpha \Sigma_i \theta_i^2$)이 추가된 선형 회귀 Lasso regression: cost funtion에 l1 regularization ($ \alpha \Sigma_i \mid \theta_i \mid $)이 추가된 선형 회귀 Elastic net: cost funtion에 l1, l2 regularization을 모두 추가한 선형 회귀

Read more

Polynomial regression

비선형 데이터를 학습하는 데 선형 모델을 사용할 수 있습니다. 각 feature의 거듭제곱을 새로운 특성으로 추가하고, 이 확장된 feature를 포함한 데이터넷에 선형 모델을 훈련시키는 방법을 polynomial regression (다항 회귀)라고 합니다.

Read more

Learning curve

모델의 일반화 성능을 평가하기 위해 cross-validation이나 learning curve에 나타나는 training error와 validation error를 비교할 수 있습니다.

Read more

Early stopping

Early stopping은 iterative algorithm에서 사용할 수 있는 regularization 방법으로 validation error가 최솟값에 도달하였다고 판단되면 바로 학습을 중지하는 방법입니다.

Read more