处理单个CSV文件中的偏移列名称的熊猫

时间:2019-01-31 16:45:12

标签: python pandas csv

我正在尝试使用熊猫导入CSV文件,该熊猫文件由几个不同的表格数据块组成,这些数据块已复制并粘贴到一个文档中。因为数据是成块的,所以只要有新的块,列名就会在文档中的各个点重复。每个块由一个空行分隔。此外,列名列表始终相同,但是它们在文档中的不同点处偏移。例如,列名称“描述”之一可能位于文档的一个块的A列中,而下一个块的位于B或C列中。

是否有使用pd.read_csv()处理此问题的简便方法?也许可以使用pd.read_csv()从一个CSV文档中创建多个数据框?

我尝试过:

 df = pd.read_csv('path/file.csv', header=[3, 2567, 3060])

其中列表中的每个int是一个新块。但是我遇到了标记错误:

 ParserError: Error tokenizing data. C error: Expected 52 fields in line 3701, saw 109

0 个答案:

没有答案
相关问题