我是Pandas的新手,我正试图将各种csv资源的金融时间序列导入到Pandas中。但是所有的csv都有不同的头文件,这意味着我目前需要构建自定义逻辑来处理每个头文件。我想知道是否有可用的库或其他实用程序将它们变成标准化格式。
例如,来自一个供应商的时间序列可能会使用"Trade Date"
与使用"Date"
或"TradeDate"
的另一个时间序列。此外,此列中的日期格式因源而异,因此我需要处理。同样,"Open"
,"OpenPx"
和"Open Price"
都是一样的。
最后,有些csv在第一行或最后一行(例如"This data is the property of ..."
)中包含无用的文字,我想自动删除。
目前我正在使用df = pandas.read_csv()
读取非标准化数据,然后使用笨重的代码删除不必要的顶级文本并将标题名称更改为单个标准化集。如果它存在,我想要更优雅/更容易维护的东西。
提前致谢!