必威英雄联盟问题标记[体操]

对于涉及必威英雄联盟到所谓的“健身房”的框架问题。

32个必威英雄联盟问题
通过过滤
标记
1
投票
1回答
60次

什么是健身房突破RAM环境中的RAM状态?

我曾经遇到过健身房的环境,并决定建立AI播放突围。这里是链接:https://gym.openai.com/envs/Breakout-ram-v0/。该文件说,国家是...
0
0答案
39次

如何为自定义问题创建MDP (RL)环境?

我正在尝试使用RL/GA解决资源调度问题。我被困在如何为问题创建一个自定义环境和实际执行一些测试。我阅读并实现了Q-…
0
0答案
8的观点

没有已注册的env,其id: BanditTenArmedGaussian-v0用于OpenAI包gym_[已迁移]

我做了以下说明:混帐克隆https://github.com/JKCooper2/gym-bandits.git CD健身房,土匪点子安装-e。安装完成后:...
1
投票
1回答
33的观点

我如何用强化学习建模并解决骑士之旅的问题?

我读过骑士之旅的问题。我想用OpenAI健身房的强化学习算法来解决这个问题。所以,我想做一个能在国际象棋桌上移动的机器人,就像……
1
投票
0答案
29日视图

纸牌游戏婴儿床的活动空间应该是什么?

我正在为纸牌游戏创建一个环境,代理将在游戏的第一阶段选择丢弃某些纸牌,并使用剩余的纸牌进行游戏。(游戏是婴儿床如果…
0
0答案
16的观点

OpenAI健身房:一步完成多个动作

我试图设计出多个用户/玩家随着时间的推移执行操作的OpenAI健身房环境。它是基于全面和每个用户都需要采取行动的全面评估和前...
2
1回答
43岁的观点

当奖励与行动结果挂钩时,我如何实施政策评估?

我正在观看youtube上的斯坦福强化学习视频。其中一项作业要求为Gym的FrozenLake必威电竞-v0环境的策略评估编写代码。在课程中(和书中我有…
1
投票
0答案
19次

如何OpenAI健身房的字典空间整合到一个强化学习的框架?

我采取一个健身房环境,我有几个输入数组作为我的输入(大小不同)。我的环境融入健身房的最简单的方法就是用字典空间,我的...
1
投票
0答案
12次

运行在健身房一个简单的图形网络例如

这是一个固定的例子,运行在健身房开放ai…
2
0答案
41次

如何制定在健身房状态动作空间正常化/概率的条件?

我打算为open-ai的健身房开发一个定制的环境。我的目标是让一个代理学习(在额外的目标中)从一个连续的动作空间(即空间…
2
2答案
46次

在强化学习中,我应该总是从相同的开始状态开始吗?

在一个RL代理的章节式培训中,我应该总是从相同的初始状态开始,还是可以从几个有效的初始状态开始?例如,在健身房,我应该……
1
投票
0答案
22次

如何定义一个类数组输入的观察和操作空间?

我正在处理一个问题,我想把它实现为一个强化学习问题,并把它集成到OpenAI的健身房。
1
投票
0答案
12次

当我在OpenAI的健身房使用稳定基线时,如何添加无效动作的逻辑?

我想把我的环境集成到OpenAI的健身房中,然后使用稳定的基线库来训练它。稳定基线下的学习方法是单线学习,你不。
1
投票
0答案
22次

我应该如何避免非法状态中OpenAI的健身房?

我试图做一个模拟的问题健身房环境。在我的健身房的环境中,我有一组非法状态,我不想我的经纪人去到他们。什么是添加这种最简单的方法...
2
1回答
51的观点

我怎样才能实现对8自由度机器人手臂TRPO奖励功能?

我需要一个8自由度的机械手臂来移动指定的点。我需要使用OpenAI gym实现TRPO RL代码。我已经有了gazebo环境。但是我不确定如何……

15 三十 50 每页