Deep-Reinforcement-Learning Imitation Learning 模仿学习一般指从人类专家提供的范例中提取状态-标签数据对构造训练样本,从而监督学习得到最优策略模型。 Multi-Agent RL 多智能体强化学习是多智能体系统与强化学习的结合,主要研究多智能体在同一环境下面对不同任务的决策问题。