我有一个类似下面的csv文件
a,v,s,f
china,usa,china and uk,france
india,australia,usa,uk
japan,south africa,japan,new zealand
我试图通过删除每行中重复的单词来获得如下所示的输出
a v s f
0 china usa and uk france
1 india australia usa uk
2 japan south africa new zealand
我正在做什么
import pandas as pd
from io import StringIO
data="""a,v,s,f
china,usa,china and uk,france
india,australia,usa,uk
japan,south africa,japan,new zealand"""
df= pd.read_csv(StringIO(data).decode('UTF-8') )
from collections import Counter
def trans(x):
d=[y for y in x]
i=0
while i<len(d):
j=i+1
item=d[i]
while j<len(d):
if item in d[j]:
d[j]=d[j].replace(item,'')
j+=1
i+=1
return d
print df.apply(lambda x:trans(x),axis=1 )
只要我将数据输入变量&#39;数据&#39;它就可以正常工作。但是如果我想通过data = pd.read_csv("trial.csv")
从csv文件导入它,它就不起作用了。我收到一条错误消息'DataFrame' object has no attribute 'decode'
。如何使用pandas从CSV文件读取数据并将输出写入CSV文件?我哪里错了?