我想了解如何将pd.Dataframe
应用于多处理以提高效率。
正常:
df = pd.read_csv('abc.csv')
def split(df, column):
output_df = pd.DataFrame()
for rows in df.iterrows():
row_data = rows[1]
column_split = row_data[column].split(',')
while '' in column_split: column_split.remove('')
for row_iter in set(column_split):
row_data[column] = row_iter
output_df = output_df.append(row_data)
print('Done',rows[0], 'row')
return (output_df)
split(df, 'a')
如何将multiprocessing
应用于多参数?