提交 5878d017 编写于 作者: X xiaowei_xing

test

上级 a8a1894a
......@@ -147,6 +147,6 @@ $$
我们可以选择最大化 $Q(a)$ 的标准差的动作:
$$
a_{t}=\mathop{\arg\max}_{a\in A}(\mu_a + c\frac{\sigma_{a}}{\sqrt{N(a)}})。
a_{t}=\mathop{\arg\max}_ {a\in A}(\mu_a + c\frac{\sigma_{a}}{\sqrt{N(a)}})。
\tag{11}
$$
\ No newline at end of file
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册