刷POJ、LeetCode(半人工半智能)的baseline已出 (#78) · Issue · PaddlePaddle / PARL

刷POJ、LeetCode(半人工半智能)的baseline已出

Created by: kosoraYintai

经过N次的超参数调整，使用Rainbow（Double-Q + SegmentTree + Advantage）解决八数码问题的模型终于训练完毕。在不知道如何搜索最优解的情况下，根据reward的返回信息，从0开始训练，并自动生成了打表代码。没想到的是，居然冲到了LeetCode的Top1，成为了默认的submission！(虽然本地使用A*算法对拍正确率为98.6%，但并不影响AC，呵呵) 所以，困扰我三年以上的一系列问题终于解决： 1、不少知乎大V认为：有了机器学习算法之后，传统《算法导论》了解即可，不需要精读，两者联系不大。 2、99%脉脉帖子认为：刷算法题只是为了应付面试而已，工作上用不到 3、如何使用机器学习解决传统图搜索和离散优化问题？又如何使用传统动态规划和树递归优化深度学习模型？有了PARL后，以上困惑真的是迎刃而解了——两手抓两手都要硬即可，不仅要要刷更多的题，也要学习更多的模型。最后，为PARL打call：深度强化学习框架PARL——联结传统数据结构与算法和新兴深度学习算法的桥梁，算法工程师的不二选择！ O(∩_∩)O