我正在处理超过100,000条数据,问题是它是以非常不利的格式pdf编写的。我不知道如何分离数据。我正在使用pandas和matplotlib对这些数据进行一些基本的绘图。我无法弄清楚如何使用此功能制作csv。
例如:
Property 1
Data 1
Data 2
Data 3
Property 2
Data 4
Data 5
Data 6
我尝试使用查找和替换,但是这样做没有格式化,我无法弄清楚,但是我没有时间从字面上浏览每个数据并手动添加逗号。
我希望能够将每个属性绘制为一列,而每个数据都是一个单元格。
答案 0 :(得分:0)
1)您可以将数据复制并粘贴到excel文件中。然后,您可以通过依次进入“数据”和“文本到列”来拆分列。
2)如果您已经在python中读取数据框,并且需要将一列拆分为2-您可以根据原始数据在数据框中创建其他列。