将数据集从文件重塑为元组

时间:2018-02-10 08:29:16

标签: python database numpy dictionary

我有一个原则相对简单的问题,但这让我很困惑。

所以我有一个包含许多不同数据文件的文件夹,如下所示:

4
val__for_label_0    val_for_label_1 val_for_label_2 val_for_label_3  ...... 
A    value_1         value_2         value_3        value_4
B    value_1         value_2         value_3        value_4
C    value_1         value_2         value_3        value_4
D    value_1         value_2         value_3        value_4

对于所有这些文件,我想以下列方式提取信息并存储它。 对于每个文件一个元组(int,dict,dict)

  • 其中'int'是左上角的第一个数字。

  • 在第一个字典中我已经知道了标签,我想用这种方式用标签值填充它:“some_label_i”:“val_for_label_i”表示第二行的所有值。

  • 第二个字典包含“letter”:“[value_1,value_2,value_3]”在同一行中,对于以字母开头的其他每一行。我不需要在行上包含第4个值。

您是否有建议如何以最有效,快速和强大的方式进行?还有一些方法可以在一个有组织的数据库中实现所有元组(每个文件中的一个),易于处理和访问python中的numpy?

提前感谢您的帮助!

0 个答案:

没有答案