转换器模型 问答列表

Transformer 在训练期间工作完美,而在推理中工作得很糟糕?

作者:mrghafari 提问时间:11/6/2023

我在我的架构中添加了三层转换器,任务是压缩。训练验证和损失在训练期间工作得很好,而在推理过程中,情况很糟糕,准确性显着下降。我不确定这是否与过拟合有关,但情节至少没有显示(如果我没错的话)。变压器怎么...


共1条 当前第1页