From 8d441a2be7545fc1651196ec234620e3bc7484db Mon Sep 17 00:00:00 2001 From: xiaowei_xing <997427575@qq.com> Date: Thu, 6 Feb 2020 13:45:17 +0900 Subject: [PATCH] test --- docs/14.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/docs/14.md b/docs/14.md index 81fb15e..e1b31d8 100644 --- a/docs/14.md +++ b/docs/14.md @@ -94,4 +94,4 @@ $\bullet$ 有效地结合规划和抽样来打破维度灾难(如围棋) ### 5.1 基于 MCTS 的围棋(MCTS for Go) -作为一个双人游戏,围棋需要一些相当自然的扩展以应用前面提到的 MCTS 算法。我们现在构建一个极小极大树,白色节点寻求最小化奖励,黑色节点寻求最大化奖励。我们在黑色节点使用前面提到的 UCB,在白色节点使用 LCB(置信下界)即 $\mathop{\min}_{a}Q(s,a)-\sqrt{\feac{2\log N(s)}{N(s,a)}}$(因为它们寻求最小化奖励)。 \ No newline at end of file +作为一个双人游戏,围棋需要一些相当自然的扩展以应用前面提到的 MCTS 算法。我们现在构建一个极小极大树,白色节点寻求最小化奖励,黑色节点寻求最大化奖励。我们在黑色节点使用前面提到的 UCB,在白色节点使用 LCB(置信下界)即 $\mathop{\min}_{a}Q(s,a)-\sqrt{\frac{2\log N(s)}{N(s,a)}}$(因为它们寻求最小化奖励)。 \ No newline at end of file -- GitLab