通过 numpy 对循环进行矢量化,以实现 qlearner/dyna-q
作者:accordion1234 提问时间:11/8/2023
我有一个 100 x 4 大小的 2d numpy 数组 A(q 表)和另一个数组 B(体验表),它不断更新一个 4 元素元组(代表状态、操作、state_prime、奖励)。我需要从数组 B 中随机...
Q-学习 问答列表
作者:accordion1234 提问时间:11/8/2023
我有一个 100 x 4 大小的 2d numpy 数组 A(q 表)和另一个数组 B(体验表),它不断更新一个 4 元素元组(代表状态、操作、state_prime、奖励)。我需要从数组 B 中随机...