大規模・複雑な問題を扱うには,自律ロボット群によるマルチエージェントシステムが適しています. しかし,従来の枠組みの多くはシステムの何処かしらにシステム全体を把握する中央集権システムを有しており,問題の規模に対してスケーラブルになっていませんでした. この研究では,自律ロボット群が自律分散的に最小限の相互通信を通じて互いの役割を理解し協調するボトムアップ型マルチエージェント強化学習を提案しています.
その中で,例えば以下のような問題解決に取り組んでいます.
- 他エージェントの確率的報酬予測に基づいた報酬整形
- エージェント間の利害関係のオンライン推定
また,提案する枠組みではヒトもエージェントとして参画可能なため,ヒト・ロボット協調システムへの応用も行っています.