”算法实践“ 的搜索结果

     Q-Learning算法与Sarsa算法对比 相同点: 1. 都属于基于价值(value-based)算法的分类,都不需要神经网络。 2. 基本公式相同: 不同点: 1. Sarsa属于on-policy算法,Q-Learning属于off-policy算法。...

10  
9  
8  
7  
6  
5  
4  
3  
2  
1