我正在尝试使用熊猫导入CSV文件,该熊猫文件由几个不同的表格数据块组成,这些数据块已复制并粘贴到一个文档中。因为数据是成块的,所以只要有新的块,列名就会在文档中的各个点重复。每个块由一个空行分隔。此外,列名列表始终相同,但是它们在文档中的不同点处偏移。例如,列名称“描述”之一可能位于文档的一个块的A列中,而下一个块的位于B或C列中。
是否有使用pd.read_csv()处理此问题的简便方法?也许可以使用pd.read_csv()从一个CSV文档中创建多个数据框?
我尝试过:
df = pd.read_csv('path/file.csv', header=[3, 2567, 3060])
其中列表中的每个int是一个新块。但是我遇到了标记错误:
ParserError: Error tokenizing data. C error: Expected 52 fields in line 3701, saw 109