了解简单的 LSTM pytorch-解网

问：

import torch,ipdb
import torch.autograd as autograd
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.autograd import Variable

rnn = nn.LSTM(input_size=10, hidden_size=20, num_layers=2)
input = Variable(torch.randn(5, 3, 10))
h0 = Variable(torch.randn(2, 3, 20))
c0 = Variable(torch.randn(2, 3, 20))
output, hn = rnn(input, (h0, c0))

这是文档中的 LSTM 示例。我不知道了解以下几点：

什么是output-size，为什么没有在任何地方指定它？
为什么输入有 3 个维度。5 和 3 代表什么？
h0 和 c0 中的 2 和 3 是什么，它们代表什么？

编辑：

import torch,ipdb
import torch.autograd as autograd
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.autograd import Variable
import torch.nn.functional as F

num_layers=3
num_hyperparams=4
batch = 1
hidden_size = 20
rnn = nn.LSTM(input_size=num_hyperparams, hidden_size=hidden_size, num_layers=num_layers)

input = Variable(torch.randn(1, batch, num_hyperparams)) # (seq_len, batch, input_size)
h0 = Variable(torch.randn(num_layers, batch, hidden_size)) # (num_layers, batch, hidden_size)
c0 = Variable(torch.randn(num_layers, batch, hidden_size))
output, hn = rnn(input, (h0, c0))
affine1 = nn.Linear(hidden_size, num_hyperparams)

ipdb.set_trace()
print output.size()
print h0.size()

RuntimeError：预期矩阵，得到 3D、2D 张量

神经网络 LSTM PyTorch 循环神经网络

单元中的每个 sigmoid、tanh 或隐藏状态层实际上是一组节点，其数量等于隐藏层大小。因此，LSTM单元中的每个“节点”实际上是一簇正常的神经网络节点，就像在密集连接的神经网络的每一层中一样。因此，如果将 hidden_size = 10 设置为 10，则每个 LSTM 块或单元都将具有具有 10 个节点的神经网络。 LSTM 模型中的 LSTM 模块总数将等同于序列长度的总数。

这可以通过分析 nn 之间示例的差异来看出。LSTM 和 nn.LSTM评论：

https://pytorch.org/docs/stable/nn.html#torch.nn.LSTM

和

https://pytorch.org/docs/stable/nn.html#torch.nn.LSTMCell

上一个：数值稳定的 softmax

下一个：对数对数图线性回归

了解简单的 LSTM pytorch

Understanding a simple LSTM pytorch

评论

评论