Question

我正在尝试使用熊猫导入CSV文件，该熊猫文件由几个不同的表格数据块组成，这些数据块已复制并粘贴到一个文档中。因为数据是成块的，所以只要有新的块，列名就会在文档中的各个点重复。每个块由一个空行分隔。此外，列名列表始终相同，但是它们在文档中的不同点处偏移。例如，列名称“描述”之一可能位于文档的一个块的A列中，而下一个块的位于B或C列中。

是否有使用pd.read_csv（）处理此问题的简便方法？也许可以使用pd.read_csv（）从一个CSV文档中创建多个数据框？

我尝试过：

 df = pd.read_csv('path/file.csv', header=[3, 2567, 3060])

其中列表中的每个int是一个新块。但是我遇到了标记错误：

 ParserError: Error tokenizing data. C error: Expected 52 fields in line 3701, saw 109

处理单个CSV文件中的偏移列名称的熊猫

0 个答案: