在熊猫中创建多维数据集

时间:2019-04-24 01:34:37

标签: python pandas

我正在研究一个问题,考虑到尺寸尺寸,很难概念化我需要做的事情。我有各种格式的CSV文件:

Date     Close    Volume  Target
1/1/18   120.1    223     0
1/2/18   112.1    219     1
1/3/18   175.1    224     0

每个csv文件代表一个单独的样本(一家公司的历史股票数据)。

我想获取多个与此类似的csv文件并将其连接起来,以便将它们包含在单个数据集中。因此,现在将整个集变成一个样本(一只股票),而不是将csv文件中的每个日期都作为观察值(样本)。每个内部都有其日期样本。然后,我计划通过逻辑回归算法运行此程序以预测目标。我可以将这种情况概念化的唯一方法是执行以下操作:

Date     Close    Volume  Target
1/1/18   120.1    223     0
         88.1     120     1
1/2/18   112.1    219     1
         78.1     230     0
1/3/18   175.1    224     0
         89.1     112     1

对我来说,这种设置没有太大意义,因为现在有重叠吗?每个价格集都有明显不同,但现在在同一列中。

如果有人能帮助我指出正确的方向,我将不胜感激。工作代码示例非常有帮助。另外,还添加了一些上下文,用于连接一组库存的csv文件,因此以前可能有人使用过这种数据。

谢谢。

0 个答案:

没有答案