宮崎で開催された,IEEE International Conference on Systems, Man, and Cybernetics (SMC2018)で,
「Bottom-up Multi-agent Reinforcement Learning for Selective Cooperation」
というタイトルで指導学生が発表しました.
本研究では,マルチエージェント強化学習(MARL)を完全に自律分散化するための問題設定としてボトムアップ型MARLを提起しています. その中で集団行動を得るために必要な条件を数理的に精査し,その現実的な解法として他エージェントの報酬の予測とその精度に基づいた重み付け手法を提案しました. 予測精度を高めるための探索ボーナスといった工夫も取り入れることで,動力学ロボットシミュレーション上での協調タスクの学習に成功しました.