跳到主要内容
报告

多主体学习中的可能与不可能

抽象的

交互式学习本质上比单主体学习更为复杂,因为学习的行为会改变要学习的事物。如果代理A试图了解代理B,则A’她的行为自然取决于她到目前为止所学的知识,也取决于她希望接下来学到的东西。但是A’B可以观察到其行为,因此B’A尝试学习的结果可能会改变其行为。 B尝试了解A的情况也是如此。

此反馈循环是多主体学习情况的核心且不可避免的功能。这表明适用于单代理学习问题的方法在多代理设置中可能会失败。它甚至暗示学习通常可能会失败,也就是说,可能存在以下情况: 规则允许玩家互相学习’完全令人满意的行为事实是这样的:在下一节中,我将 不确定性原则 对于战略互动而言,如果其他参与者的收益(以及他们的潜在行为)存在事前不确定性,那么即使有无数次重复,理性参与者也无法学会预测彼此的行为游戏(Foster and Young,2001;有关相同精神的更早成果,请参见Binmore(1987)和Jordan(1991,1993))。

获取布鲁金斯的每日更新