必威英雄联盟问题标记为[实现]

有关与人必威英雄联盟工智能相关的软件/算法的实施的问题。betway电竞

65个必威英雄联盟问题
通过过滤
标记
0
0答案
20的观点

这个实现变压器自我注意的查询维度和关键张量是否正确?

查看本教程matmul_qk =特遣部队。matmul(q, k, transpose_b=True) #(…、seq_len_q seq_len_k)是两个张量乘以形状的输出:…
0
0答案
12次观点

维护复杂状态和操作空间的值表[关闭]

我需要在Python中为一个复杂的环境编写值函数。每个状态都是一个大元组,每个操作都是一个Numpy数组。如果它们都是整数,那么我可以实现值函数为…
1
投票
0答案
29日视图

有人能给我解释一下这个使用哈希表的Tile编码的实现吗?

下面的代码改编自这个实现. ...
1
投票
1回答
46岁的观点

如何在CNN中将图像从一个卷积层传递给另一个卷积层?

我现在正在尝试从头开始写一个CNN,但是我不知道如何从一个最大池层向下一个卷积层提供信息。具体地说,我不知道该怎么办……
5
0答案
47岁的观点

Wasserstein GAN:执行批评损失,对吗?

WGAN论文具体提出了算法1(参见第8页)。现在,他们还说明了他们对批评家和产生者的损失是什么。当实现临界损失时(所以第5行和第6行算法…
1
投票
0答案
15的观点

共享双DQN中的神经网络层(除了最后一层)有意义吗?

背景:双q学习的引入是为了防止q学习的最大偏差。而不是学习一个单一的Q-network,我们可以学习两个(或一般$K > 1$),我们的Q-estimate将…
1
投票
1回答
59次观点

在PPO中,如何从策略网络中采样(或生成)连续动作?

我正在尝试详细地理解和重现最近策略优化(PPO)算法。在介绍算法的文章中,我发现遗漏了一件事,那就是action $a_t$…
1
投票
1回答
28日视图

平均池化等价于带有特定常数核的跨步卷积吗?

在我看来,平均池可以被一个带有常数核的跨步卷积所取代。例如,一个3x3池就相当于一个大步卷积(大步$3$)和一个$3 \…
1
投票
0答案
39岁的观点

我该如何编写《机器学习:算法视角》一书中的公式4.57呢?

考虑《机器学习:算法视角》(Machine Learning: An algorithm Perspective)一书第4.6节中的公式4.57,其中解释了softmax函数的导数$$\delta_o(\kappa) = (y_\kappa -…
1
投票
0答案
31日视图

在A2C算法的OpenAI实现中,step_model和train_model有什么区别?

我正在努力理解A2C的OpenAI实现基线(版本2.9.0)包。据我所知,一…
1
投票
2答案
180的浏览量

什么是“带代码的论文”的替代方案?

有很多研究论文值得一读。我们可以很容易地阅读论文,但相关代码(不一定是论文作者开发的官方代码)通常…
1
投票
1回答
61的浏览量

需要保存和加载哪些变量,以便DQN模型从它停止的地方开始?

TensorFlow允许用户保存权重和模型架构,但是,这将是不够的,除非某些其他变量的值也被存储。例如,在DQN中,如果$\…
2
1回答
41岁的观点

我如何创建一个嵌入层来将单词从零转换到向量空间?

对于即将到来的项目,我正在尝试构建一个神经网络,用于在没有使用库的情况下从头开始对文本进行分类。这需要嵌入层,或者一种转换为某些词的方法......
1
投票
0答案
24日视图

在这篇论文中用来视觉化注意力的分数是多少?

我正在阅读这篇发表在《欢喜》杂志上的论文《全球-本地自我关注对话状态跟踪和跟踪实施》。我想知道有没有人能解释一下什么是变量或者分数……
1
投票
1回答
166的浏览量

什么是健身房里的RAM状态?

我遇到了健身房的环境,并决定创造出玩breakout的AI。链接如下:https://gym.openai.com/envs/Breakout-ram-v0/。文件上说这个州是…

15 30. 50 每个页面