我已经使用gensim在Python中进行文本汇总。我希望将汇总的输出存储在同一数据框中的不同列中。
我使用了以下代码:
for n, row in df_data_1.iterrows():
text=df_data_1['Event Description (SAP)']
print(text)
*df_data_1['Summary']=summarize(text)*
print(df_data_1['Summary'])
该代码的第4行出现错误,该错误指出:TypeError:预期的字符串或类似字节的对象。
如何将处理后的文本存储在熊猫数据框中
答案 0 :(得分:0)
如果不是字符串或字节,那是什么?您可以检查汇总功能的类型,然后从那里继续前进。
test_text = df_data_1['Event Description (SAP)'].iloc[0]
print(type(summarize(test_text))
另一句话:通常,您希望避免在数据帧上循环(请参见discussion)。如果要将函数应用于整个列,请按如下所示使用df.apply():
df_data1[‘Summary’] = df_data1['Event Description (SAP)'].apply(lambda x: summarize(x))