必威英雄联盟问题标记(函数近似)

有关函数必威英雄联盟近似概念的问题。例如,在RL的上下文中涉及必威英雄联盟到使用神经网络(它是一个函数近似器)来近似值函数的问题,或者与通用近似定理有关的问题。

50个必威英雄联盟问题
过滤
排序
标记
1
投票
0答案
29次观点

有人可以向我解释使用哈希表的瓷砖编码的实现吗?

下面的代码改编自这个实现. ...
1
投票
0答案
28次观点

单调递增函数更容易学习吗?

一个单调递增函数是这样一个函数,当x变大时,它的输出也变大。所以,如果标出来,它永远不会下降。尽管输出可能保持不变。逻辑上这看起来像…
0
0答案
15次观点

AlBERT中的参数共享是否类似于同一个函数在输入上的重复应用?

我读了AlBERT,发现它的架构在编码器的各层之间使用了“参数共享”。他们提到这样做是为了节省模型空间,减少训练参数……
1
投票
0答案
26意见

在Perceptron可计算的范围内的许多功能的最小上限是什么?

我正在读这本书的这一章,我在看最后一页的问题。必威英雄联盟谁能给我解释一下最后一页的问题2,或者给我举个例子,让我理解一下?…
8
0答案
65的浏览量

近似n次多项式需要多少神经元?

我从本指南中了解了通用近似定理。它指出即使具有单个隐藏层的网络也可以近似在某些界限内的任何功能,给定足够的数字......
2
0答案
29次观点

均匀抵消如何与函数近似的工作?

我得到了绦虫如何工作的根本思想,但是,在巴顿和萨顿的书籍,加固学习:介绍(第2版),一个图表,第219页(图9.11),显示了......
1
投票
0答案
21次观点

输入和输出各为未知函数的神经网络结构

我正在尝试设置一个神经网络架构,能够从另一个(红色曲线)的点来学习一个功能(蓝色曲线)的点。我认为这可能是某种方式......
4
1回答
103意见

模型能否在已解决的游戏中获得100%的准确性?

我今天有一个问题,我觉得它必须有一个答案,所以我在购物。如果我们询问必威电竞模型来学习二进制或功能,我们会与每个型号(据我所知)获得完美的准确性......
6
1回答
125的浏览量

逼近$sin$函数的最小可能网络

主要目标是:找到最小的神经网络来近似$sin$函数。此外,我想找到一个定性的原因,为什么这个网络是最小的可能网络。我有……
2
1回答
42次观点

为什么以州$ s $,$ \ mu(s)$为州花费的时间的一小部分,而不是在更新的参数的规则中?

我正在阅读由Sutton和Barto所著的“强化学习:简介(第二版)”。在第9节“近似政策预测”中,它首先给出了均值的平方…
2
1回答
35次观点

我们如何在持续任务中获得平均奖励设置的表达式?必威电竞

在平均奖励设置:$ $ r(\π)\ doteq \ lim_ {h \ rightarrow \ infty} \压裂{1}{h} \ sum_ {t = 1} ^ {h} \ mathbb {E} (R_ {t} | S_0,现代{0:t - 1} \ sim \π)$ $ $ $ r(\π)\ doteq \ lim_ {t \ rightarrow \ infty} \ mathbb {E} (R_ {t}…
4
2答案
81的浏览量

在短走廊任务中,为什么所有的状态在函数近似下都是相同的?必威电竞

这是来自萨顿和巴托的书中的短走廊问题。这里写着:这个问题很困难,因为所有的状态在函数近似下都是相同的,但是…
6
1回答
100的浏览量

为什么神经网络是由梯度体积优化的其他分类函数

考虑一个神经网络,例如神经网络。如尼尔森在这里提出的那样。Abstractly, we just construct some function $f: \mathbb{R}^n \to [0,1]^m$ for some $n,m \in \mathbb{N}$ (i.e. the dimensions of the input ...
1
投票
0答案
45意见

求解MRP的参数向量的校正维度的正确维度近似?

我正在跟随伦敦大学学院(UCL)和DeepMind合作开设的一门课程,试图更多地了解RL,这门课程已经向公众开放。这门课我学得差不多了……
0
0答案
27日视图

从标量输入到时间序列输出的神经网络架构?

我有一个问题,我知道p个特征,每个特征都是标量值,其中一组特征的输出是一个时间历史。是否有一个特定的神经网络(NN)类型架构可以…

15. 30. 50. 每页