我有一个数据集,该数据集的每一列都有多种格式,类似于展示的here并使用要素列进行分类。我正在尝试做类似的事情,除了我想用看似功能列不支持的列对数据进行分类。我已经完成了自己的预处理,因此以[段落,[单词向量,单词上下文]]格式存储了一些数据,其中数组中元素的数量可以变化(并且是多维的,即使对于数据集中的一个“单元”),或某些具有更多/更少维度的列(取决于特定列的上下文)。其他列是简单的单个数字或一维数组(某些具有固定大小,另一些具有可变性)。
我想用这些列训练一个多类LSTM分类器,尽管浏览了有关张量的文档和我可以找到的所有示例,但我仍然不知道如何加载参差不齐的张量。如果有的话,在Tensorflow中怎么可能?我希望保留结构而不是将其展平,并且宁愿不填充它(尽管对于NN结构而言这很困难),因为我的训练集相对较小。