遍历Torchtext.data.BucketIterator对象将引发AttributeError'Field'对象没有属性'vocab'

时间:2018-07-08 12:08:44

标签: python iterator pytorch torchtext

当我尝试查看批处理时,通过打印BucketIterator对象的下一次迭代,将抛出AttributeError

tv_datafields=[("Tweet",TEXT), ("Anger",LABEL), ("Fear",LABEL), ("Joy",LABEL), ("Sadness",LABEL)]
train, vld = data.TabularDataset.splits(path="./data/", train="train.csv",validation="test.csv",format="csv", fields=tv_datafields)

train_iter, val_iter = BucketIterator.splits(
(train, vld),
batch_sizes=(64, 64),
device=-1,
sort_key=lambda x: len(x.Tweet),
sort_within_batch=False,
repeat=False
)
print(next(iter(train_dl)))

1 个答案:

答案 0 :(得分:1)

我不确定您遇到的具体错误,但是在这种情况下,您可以使用以下代码遍历一个批处理:

for i in train_iter:
    print i.Tweet
    print i.Anger
    print i.Fear
    print i.Joy
    print i.Sadness

i.Tweet(还有其他)是形状为(input_data_length, batch_size)的张量。

因此,要查看单个批次数据(例如批次0),可以执行print i.Tweet[:,0]

val_iter(如果需要,还有test_iter也一样)。