Question

我有一个原则相对简单的问题，但这让我很困惑。

所以我有一个包含许多不同数据文件的文件夹，如下所示：

4
val__for_label_0    val_for_label_1 val_for_label_2 val_for_label_3  ...... 
A    value_1         value_2         value_3        value_4
B    value_1         value_2         value_3        value_4
C    value_1         value_2         value_3        value_4
D    value_1         value_2         value_3        value_4

对于所有这些文件，我想以下列方式提取信息并存储它。对于每个文件一个元组（int，dict，dict）

其中'int'是左上角的第一个数字。
在第一个字典中我已经知道了标签，我想用这种方式用标签值填充它：“some_label_i”：“val_for_label_i”表示第二行的所有值。
第二个字典包含“letter”：“[value_1，value_2，value_3]”在同一行中，对于以字母开头的其他每一行。我不需要在行上包含第4个值。

您是否有建议如何以最有效，快速和强大的方式进行？还有一些方法可以在一个有组织的数据库中实现所有元组（每个文件中的一个），易于处理和访问python中的numpy？

提前感谢您的帮助！

将数据集从文件重塑为元组

0 个答案: