我觉得这应该不太难,但是我还没有找到解决方案,所以我在这里寻求帮助。
我可以轻松地遍历这样的文件夹中的所有CSV文件。
import glob
path = 'C:\\path\\*.csv'
for fname in glob.glob(path):
print(fname)
我试图弄清楚如何打开每个文件并将文件名读入列表。另外,我想读取每个文件的前n行,并将每个文件的“数据类型”读入文件名下的相同列表。这些文件具有不同数量的列,并且它们都看起来像这样:
02|1|CD_6MO_SEC_MRKT_MNTH_AVG |2018-30-31
03|6|CD_6MO_WKLY |2018-30-31
04|23|CMT_10YR_MNTH |2018-30-31
05|31|CMT_10YR_WKLY_AVG |2018-30-31
因此,在这种情况下,第一列是字符串, 第二个是整数 第三个是字符串, 第四是日期。
因此,我想将以下内容写到列表中: 文件1.CSV 串: 整数: 串: 日期: 这是另一个例子。
6033888|20181001|1.6|20250901|3.362|-999.|20180101|20180101|WSJ 1-YEAR LIBOR
6033891|20181001|1.61|20251001|3.76|-999.|20180101|20180101|WSJ 1-YEAR LIBOR
6034109|20181001|1.773|20181101|3.977|-999.|20180101|20180101|WSJ 1-YEAR LIBOR
在这里,我想写(到同一列表中):
File2.CSV 串: 串: 浮动: 串 浮动: 浮动: 日期: 日期: 字符串:
这些文件没有标头,因此我想检查数据类型,并根据数据的外观对数据类型进行合理的猜测。是否有可能做到这一点?