堆栈交换网络

堆栈交换网络由174个问答社区组成,包括栈溢出,最大的,最值得开发者学习的在线社区,分享他们的知识,建立他们的事业。

访问堆栈交换

必威英雄联盟标记的问题[蒙特卡罗树搜索]

这个标签应该用于有关MCTS算法的问题(它是如何工作的/必威英雄联盟为什么工作的,潜在应用,增强功能,结合其他算法,实施,等)

27个必威英雄联盟问题
选票
答案
38视图

像蒙特卡罗搜索这样的推广算法建议基于模型的强化学习?

据我所知,蒙特卡罗树搜索算法是一种无模型强化学习(RL)的求解算法,无模型强化学习意味着代理不知道过渡和奖励模型。…
投票
答案
81视图

Montecarlotreesearch是否是解决此问题的合适方法(大操作/状态空间)?

我正在研究一个t=1,…,40周期的有限视界决策问题。在每一个时间步骤t中,(只有)代理人必须选择一个行动A(t)∈A(t),当代理处于S(t)∈S(t)状态时。…
选票
回答
29视图

为什么神经网络和机器学习与MCT合作得很好?但不是用常规的minimax游戏玩人工智能?

我经常听说MCT与神经网络和机器学习结合在一起。根据我收集的资料,MCTS使用精确的直觉(从机器学习)来评估位置。这让它变得更好…
投票
回答
44视图

有什么有趣的方法可以将蒙特卡罗搜索与标准的minimax/alpha beta算法结合起来吗?

我在游戏引擎上工作了半年左右,它使用了众所周知的算法。其中包括minimax+alpha beta修剪,迭代深化,换位表,等。。。。
选票
回答
41视图

Hearthstone人工智能如何处理随机事件

我想了解很多CCG的人工智能,如炉石。现在我知道了这种游戏中使用的主要算法之一,MCT。它分析了最有希望的行动,并扩大…
投票
回答
68视图

人工智能的加权移动评级

我的人工智能(针对纸牌游戏schnapsen)目前计算出游戏结束的所有可能方式,然后评估每一张可玩的牌/移动的获胜百分比。计算完成…
投票
回答
31视图

用更少的回合取胜来增加蒙特卡洛搜索结果的权重有意义吗?

我正在用MCT编程Connect6,蒙特卡罗树搜索是基于随机移动的。它计算在某些动作中获胜的次数。(不管是3回合还是30回合)是一个…
选票
回答
46视图

对于这个决策问题,我应该使用蒙特卡罗还是分类器?

我想建立一个模型来支持贷款保险方案的决策。这个问题有三个参与者:一个银行,贷款申请人(要求贷款的人)和顾问。必威电竞这个。。。
选票
答案
129视图

如果有足够的训练时间,AlphaGo Zero会变得完美吗?

如果有足够的训练时间,alphago zero会在理论上变得完美吗?如果不是,限制因素是什么?(完美地,我的意思是如果可能的话,它总是会赢的,即使对另一个…
选票
回答
148视图

具有很高分支因子的游戏算法(connect6)

Connect6是一个分支因子非常高的游戏示例。大约4万5千,使令人印象深刻的游戏相形见绌。在具有如此高分支因子的游戏中,您可以使用什么算法?我…
选票
回答
186视图

蒙特卡罗树搜索扩展阶段

我对MCT的具体细节感到困惑。为了说明我的问题,让我们以tic-tac-toe的简单示例为例,在选择阶段之后,当到达叶节点时,树被展开…
选票
答案
148视图

蒙特卡罗搜索(Alphazero专门使用)是否符合机器学习的条件?

据我所知,蒙特卡罗搜索是极大极小搜索节点树的一种替代方法。它通过选择一个动作(通常是最有可能…
十二
选票
答案
3K视图

如何选择最适合类似跳棋棋盘游戏的算法?

我现在对人工智能很陌生,但我对它很感兴趣。betway电竞我目前正在研究三种算法,即:极大极小,阿尔法-贝塔修剪和蒙特卡洛树搜索。
选票
答案
617视图

当真正的对手的行为可能不是随机的时候,蒙特卡洛为什么会起作用?

我正在学习蒙特卡罗算法,并努力理解以下内容:如果模拟是基于随机移动的,对手的行为建模如何有效?为了…
- 3
选票
回答
107视图

机器学习的最新进展真的是“人工”智能吗?或者仅仅是蛮力和人类设计?

当人们吹嘘人类实现了诸如蒙特卡罗搜索(MCST)等。我认为…