如何以官方方式重新初始化 Hugging Face LLaMA v2 模型的权重作为原始模型?
作者:Charlie Parker 提问时间:11/17/2023
我想重新初始化我正在使用/下载的 LLaMA v2 模型的权重。我浏览了所有文档和他们的 HF 代码中的源代码: https://github.com/huggingface/transformer...
pytorch 问答列表
作者:Charlie Parker 提问时间:11/17/2023
我想重新初始化我正在使用/下载的 LLaMA v2 模型的权重。我浏览了所有文档和他们的 HF 代码中的源代码: https://github.com/huggingface/transformer...
作者:rd142857 提问时间:11/17/2023
我已将我的模型和输入绑定到 cuda x = torch.randint(low=0, high=256, size=(1, 3, 224, 224), dtype=torch.float32).t...
作者:JJH 提问时间:11/17/2023
我将使用 Glue 生成数据集,以从 RDS 中的原始数据训练 AI 模型。根据公司的某些政策(也许是互联网封锁),魔术不起作用。所以我将压缩的模块上传到 S3,并用于导入模块,但收到以下错误消息:%...
作者:Amir 提问时间:11/17/2023
我正在研究一个多变量时间序列预测问题,使用 household_power_consumption.txt 数据集并实现 1D CNN 模型。加载数据的批处理大小为 64,序列长度为 50,特征为 7...
作者:Ramon Griffo 提问时间:11/17/2023
我有一个包含 2d 灰度图像的数据集,我想为生成器不是我关注的问题构建一个 GAN。我实际上想要一个非常好的鉴别器,能够区分真假图像(由生成器生成)。 问题是,我处理的数据不是传统的图像,图像大小是...
作者:Nukaccino 提问时间:11/16/2023
我使用带有 HuggingFace 库的 LoRA 对 RoBERTa 进行了微调,生成了多个 LoRA 文件。 我想在不更改原始模型的情况下合并这些 LoRA 权重.所以我写了如下代码。 fro...
作者:Zhu Neo 提问时间:11/17/2023
这个问题在这里已经有答案了: Python:-u 选项的意义? (2 个答案) 5天前关闭。 python -u -m torch.distributed.launch --nproc_per_no...
作者:Xing 提问时间:11/17/2023
拜托,我想知道我的模型或损失函数或数据集是否错误。 我尝试打印了很多东西进行调试,但仍然不知道问题出在哪里。 我的源代码是: import time import torch import to...
作者:Alvaro Ciudad 提问时间:11/18/2023
您好 StackOverflow 社区 :),我需要利用轴 1 中 https://www.tensorflow.org/api_docs/python/tf/clip_by_norm 的功能,用于 ...
作者:Sai Kishore 提问时间:11/17/2023
我已经为我想执行的矩阵乘法编写了一个基于 for 循环和基于 einsum 的代码。你能帮我检查它的正确性吗? ` w = torch.randn((10,32,32)) x = torch.ra...