这是我的情况....我有两个CSV文件(文件1和文件2)。 File1有大约15列,file2有大约10列。我需要从file1中获取所有15列,并从file2中提取第13列,并在名为“final.csv”的新csv文件中合并所有16列。请向我提出一些关于如何使此代码工作的想法。这是我到目前为止所拥有的......
(?<=When:\s)|(\d+)[^-]*$
答案 0 :(得分:0)
我首先要使用pandas将文件加载为表格。然后使用索引选择所需的列,合并文件,然后创建新文件。显然你不能从file2中选择第13列,如果它只有10列,那么我假设你在该文件中有13列。
import pandas as pd
file1 = pd.read_table('F:\somedata\somefolder\file1.csv', delimiter=',', header=None)
file2 = pd.read_table('F:\somedata\somefolder\file2.csv', delimiter=',', header=None)
file2_short = file2.ix[:,12:13]
new = pd.concat(file1, file2_short, axis=1)
new.to_csv('F:\somedata\somefolder\newfile.csv')
这假设你想要文件2中的第13列。如果那个列有一个标题(当然你会删除'header = None'部分)你可以选择那个......
file2_short = file2['col_13']
希望这有帮助