应用错误收集

我想了解如何将pd.Dataframe应用于多处理以提高效率。

正常：

df = pd.read_csv('abc.csv')
def split(df, column):
  output_df = pd.DataFrame()
  for rows in df.iterrows():
      row_data = rows[1]
      column_split = row_data[column].split(',')
      while '' in column_split: column_split.remove('')
      for row_iter in set(column_split):
          row_data[column] = row_iter
          output_df = output_df.append(row_data)
      print('Done',rows[0], 'row')
  return (output_df)

split(df, 'a')

如何将multiprocessing应用于多参数？

如何在Pandas上使用多参数功能进行多处理？

0 个答案: