通过 numpy 对循环进行矢量化,以实现 qlearner/dyna-q
作者:accordion1234 提问时间:11/8/2023
我有一个 100 x 4 大小的 2d numpy 数组 A(q 表)和另一个数组 B(体验表),它不断更新一个 4 元素元组(代表状态、操作、state_prime、奖励)。我需要从数组 B 中随机...
学习 问答列表
作者:accordion1234 提问时间:11/8/2023
我有一个 100 x 4 大小的 2d numpy 数组 A(q 表)和另一个数组 B(体验表),它不断更新一个 4 元素元组(代表状态、操作、state_prime、奖励)。我需要从数组 B 中随机...
作者:Sandra Grace Nelson 提问时间:11/1/2023
看,我有两个形状为 (2048,) 和 (3,) 的数组。有没有办法将其中两个结合起来?不要只是串联起来。来自 (2048,) 的所有值都应具有来自 (3,) 的值的效果。我实际上的意思是,我的图像嵌...
作者:Kamel 提问时间:11/7/2023
赏金将于明天到期。这个问题的答案有资格获得 +100 声望赏金。卡梅尔希望引起人们对这个问题的更多关注。 我想使用迁移学习在 Google Colab 中训练 Mask R-CNN 模型。为此,我正...
作者:bmasc 提问时间:4/3/2011
是否可以使用 scikit-learn K-Means 聚类指定自己的距离函数?...
作者:SpaceFox0210 提问时间:9/17/2023
我正在制作使用监督学习和强化学习来玩 Gomoku 的代理。问题发生在监督学习中。精度和损耗停止增加/减少。损失图精度图。粉红色是亚当,黄色是SGD 我的模型和源代码: def InYeongGo...
作者:Rezwan Khan 提问时间:11/12/2023
我正在尝试将强化学习连续动作值映射到实际输出。range(-1.0,1.0) 假设我有 numpy 操作数组。数组的值可以是 和 。actions = np.array([-1., 0.2, -0....
作者:Tarkik 提问时间:10/16/2023
众所周知,MLPerf 可以对 GPU 系统的 ML 功能进行基准测试。 由于带有 GPU 的 VM 价格昂贵,并且有人希望在仅使用 CPU 的系统上运行任何 ML 任务。是否可以通过 MLPerf ...
作者:skidjoe 提问时间:10/12/2021
我有以下模型,我正在尝试微调(CLIP_ViT + 分类头)。这是我的模型定义: class CLIPNN(nn.Module): def __init__(self, num_labels, ...
作者:Timio kausaki 提问时间:8/29/2023
将数据保存在数据库中后,我需要将识别的voter_NIC返回(使用yield)到前端。我使用 Jinja 作为我的前端,我尝试了很多方法,但没有一个成功。我用它来检测人脸和保存识别的用户数据,我需要在...
作者:MAHADEV BHANDARI 提问时间:10/6/2023
自 2 个多星期前以来,我一直在研究这个 LSTM 模型,但该模型没有显示出任何进展。分类报告少得可怜。 我必须为每一行添加一个虚拟类 -1,以确保为每个单元生成的序列等于具有最大行数的单元可用的行...