必威英雄联盟问题标记(multi-agent-systems)

对于多智必威英雄联盟能体系统(multi-agent systems, MAS)相关的问题,MAS是一个包含多个智能体(每个智能体都有不同的技能)的系统,它们相互协作,与环境交互。MAS面临着多个挑战,包括代理之间的协调、安全性和任务分配。必威电竞多智能体系统已广泛应用于计算机科学、土木工程和电气工程等领域。

40个必威英雄联盟问题
通过过滤
标记有
2
0答案
29日视图

Agent通信语言在多Agent系统中的地位是什么?

我目前正在为智能电网实现一个多智能体系统。有很多关于这方面的文献,有些东西让我很困惑。我读到有一个FIPA,它的目标是创建一个…
3.
1回答
31日视图

是否存在多智能体强化学习模型,其中(部分)奖励是由其他智能体而不是外部环境给予的?

传统的多智能体强化学习(multi - agent reinforcement learning, MARL)的设置是由智能体和外部环境组成的一种模式。奖励是给每个特工的-单独或…
1
投票
0答案
32的观点

设计具有大变量作用空间的深度rl策略网络

我正在尝试一个使用深度强化学习训练agent玩游戏的项目。这个项目有几个特点使神经网络的设计复杂化:动作…
0
0答案
20的观点

多智能体避碰博弈中的最优路径寻找

什么时候使用何时从起点找到最佳路径到与碰撞避免的多读游戏中的终点点?我正在控制代理商,同时在哪里有零点的想法......
0
1回答
29日视图

如何训练奖励系统的简单代理商?

我不是AI或NN的专家,我收集了来自互联网的大部分信息,我正在寻找建议和指导。我正在尝试设计一个将被所有人使用的nn ...
0
1回答
143的浏览量

如何处理在增强学习环境中,在代理人数增加或减少时?

我在A2C环境中工作,在这个环境中,代理的数量在增加或减少。环境中的动作空间不会改变,但状态会改变。
0
0答案
19日视图

我的代理是否在以下多代理DDPG实现中共享共同的批评?

我想为我的所有代理有一个共同的评论,所以我将其定义为以下内容,但因为评论在每次迭代的训练中都会发生变化,所以我不确定是否所有代理仍然共享…
4
1回答
144的浏览量

为什么一字棋被认为是一种非确定性环境?

我在阅读有关确定性和随机环境的文章时,想到了一篇文章,指出井字游戏是一种非确定性环境。但这是为什么呢?一个动作会…
4
1回答
68的浏览量

AlphaZero可以被认为是多智能体深度强化学习吗?

AlphaZero可以被认为是多智能体深度强化学习吗?我找不到明确的答案。我会说是的,它是多特工学习,因为有两个代理人对抗每个代理商......
0
0答案
39岁的观点

多智能体强化学习的集中训练和分散执行是如何实现的?

在《Deep Multi-Agent Reinforcement Learning的Bayesian Action Decoder》这篇论文中写道,我们允许集中训练,但需要分散执行,由此得出的政策……
1
投票
0答案
28日视图

有一个多代理版本的EXP3吗?

下图所示的EXP3算法(取自《对抗式土匪》和《EXP3算法》)是解决单人模式下的对抗式土匪问题。如果有……
1
投票
1回答
51的观点

多智能体学习和强化学习之间的关系是什么?

多智能体学习和强化学习之间的关系是什么?一个是另一个的子域吗?例如,声明你的研究兴趣是多智能体是否有意义…
2
0答案
36的观点

启发式如何在多个主体中起作用?

我有一个关于多主体启发式搜索的问题。我知道启发式搜索在一个代理(例如一个吃豆人)下是如何工作的,但在多个代理下我就不太明白了。假设我们有……
1
投票
1回答
65次观点

二人零和博弈的效用函数不应该在$[- 1,1]$范围内吗?

在MuZero的附录B中,他们说在二人零和博弈中,值函数被假定在$[0,1]$区间内。我对边界感到困惑:value/…
1
投票
0答案
22日视图

是否有合适的桌面游戏来检验多个代理在组间和组内合作的表现?

我想找出在MARL中检查组内和组间合作表现的有用场景。具体来说,我更喜欢桌游(如数独),它适合……

15 30. 50 每个页面