我从Torchtext文档中了解到,导入csv文件的方法是通过TabularDataset。我是这样的:
train = data.TabularDataset(path='./data.csv',
format='csv',
fields=[("label",data.Field(use_vocab=True,include_lengths=False)),
("statement",data.Field(use_vocab=True,include_lengths=True))],
skip_header=True)
“ label”和“ statement”是我的csv文件中两列的标题名称。我将它们定义为data.Field,但“标签”和“声明”似乎并未真正包含csv文件中的数据,尽管控制台毫无疑问地将其识别为数据字段对象。当我尝试使用statement.build_vocab(train,max_size = 25000)构建一个词汇表时,我发现了这个问题。我打印了len(statement.vocab),返回值为“ 2”,这显然没有反映csv文件中的实际数据。导入csv数据时我做错什么了吗?还是我的vocab构建做错了?是否存在将数据放入字段对象的单独方法?谢谢!!
答案 0 :(得分:0)
必须像这样单独定义字段
lapply(templist, function(x) apply(x[,3:5], 2, mean))
[[1]]
Estimate ci.lower ci.upper
4.310 1.122 7.498
[[2]]
Estimate ci.lower ci.upper
4.329 1.357 7.301
[[3]]
Estimate ci.lower ci.upper
4.355 1.334 7.376