奈良先端大で開催されているスプリングセミナー2017で, 受講生6名を招いて強化学習についての講義・実習を行いました.
実習は,OpenAI Gymのシミュレーション環境で連続状態・離散行動のタスクになる,CartPoleとAcrobotに対して,ガウス基底を用いた関数近似型のQ学習を実装するものでした.
奈良先端大で開催されているスプリングセミナー2017で, 受講生6名を招いて強化学習についての講義・実習を行いました.
実習は,OpenAI Gymのシミュレーション環境で連続状態・離散行動のタスクになる,CartPoleとAcrobotに対して,ガウス基底を用いた関数近似型のQ学習を実装するものでした.