分裂多次?

时间:2018-08-24 18:39:28

标签: python pandas csv matplotlib

所以我目前正在将txt文件传输到csv中。它大部分都已清理,但即使拆分后,我的某些数据之间仍然有空列。

下面是我凌乱的CSV文件 Messy_CSV_FILE 这是我当前的代码:

Sat_File = '/Users'
output = '/Users2'
import csv
import matplotlib as plt
import pandas as pd
with open(Sat_File,'r') as sat:
    with open(output,'w') as outfile:
        if "2004" in line:
            line=line.split('  ')
            writer=csv.writer(outfile)
            writer.writerow(line)

基本上,我只是想消除我提供的CSV图片中各列之间的间隙。谢谢!

1 个答案:

答案 0 :(得分:1)

您可以使用python Pandas库清除空白列:

import pandas as pd
df = pd.read_csv('path_to_csv_file').dropna(axis=1, how='all')
df.to_csv('path_to_clean_csv_file')

基本上,我们:

  1. 导入熊猫库。
  2. 将csv文件读入一个名为df(代表数据帧)的变量。 比起我们使用dropna函数,它可以丢弃空的列/行。 axis = 1表示放置列(0表示行),而how ='all'表示放置列中的所有值均为空。
  3. 我们将原始数据帧df保存到一个新的原始csv文件中。

$$$ Pr0f!t $$$