我有4个文件夹,每个文件夹都有500个CSV文件。 我想在一个CSV中收集CSV文件的所有名称,以便通过python进行可视化。
所有CSV文件只有一列。如何将这些行拆分为多列[2016 05 30:t5-45 + 09],(这里没有逗号,没有空格)
我想将所有信息放在列中,如:
year | month | day
2016 | 05 | 30
columns_name =['col1 ','col2','col3']
read=pd.read_csv("file path", header=None, names=columns_name)
答案 0 :(得分:0)
您可以使用os.listdir()
列出目录路径并阅读其中的所有文件,如here中所述。
至于将列拆分为3,首先必须按照here所述使用csv.reader
迭代csv的每一行。然后对于每一行,将它们转换为3个部分并将它们写回新的csv。您可以为转换执行以下操作:
import re
row = ['2016 05 30:t5-45+09']
res = re.search('(\d{4}) (\d{2}) (\d{2}):.*', row[0], re.IGNORECASE)
print(res.groups()) # ('2016', '05', '30')
您可以找到有关如何在same doc中将它们写回csv的示例。