강화학습의 기반이 되는 dynamic programming에서 중심이 되는 bellman equation에 대한 유도식을 유도해보았다. 2년 전 쯤, 한창 강화학습 공부할 때 유도해놓았던 건데 중간 과정이 어디에서도 찾기가 힘들었던 기억이 난다.
PREVIOUSEtc
강화학습의 기반이 되는 dynamic programming에서 중심이 되는 bellman equation에 대한 유도식을 유도해보았다. 2년 전 쯤, 한창 강화학습 공부할 때 유도해놓았던 건데 중간 과정이 어디에서도 찾기가 힘들었던 기억이 난다.