我正在研究一个问题,考虑到尺寸尺寸,很难概念化我需要做的事情。我有各种格式的CSV文件:
Date Close Volume Target
1/1/18 120.1 223 0
1/2/18 112.1 219 1
1/3/18 175.1 224 0
每个csv文件代表一个单独的样本(一家公司的历史股票数据)。
我想获取多个与此类似的csv文件并将其连接起来,以便将它们包含在单个数据集中。因此,现在将整个集变成一个样本(一只股票),而不是将csv文件中的每个日期都作为观察值(样本)。每个内部都有其日期样本。然后,我计划通过逻辑回归算法运行此程序以预测目标。我可以将这种情况概念化的唯一方法是执行以下操作:
Date Close Volume Target
1/1/18 120.1 223 0
88.1 120 1
1/2/18 112.1 219 1
78.1 230 0
1/3/18 175.1 224 0
89.1 112 1
对我来说,这种设置没有太大意义,因为现在有重叠吗?每个价格集都有明显不同,但现在在同一列中。
如果有人能帮助我指出正确的方向,我将不胜感激。工作代码示例非常有帮助。另外,还添加了一些上下文,用于连接一组库存的csv文件,因此以前可能有人使用过这种数据。
谢谢。