Question

我有一个类似下面的csv文件

a,v,s,f
china,usa,china and uk,france
india,australia,usa,uk
japan,south africa,japan,new zealand

我试图通过删除每行中重复的单词来获得如下所示的输出

       a             v        s            f
0  china           usa   and uk       france
1  india     australia      usa           uk
2  japan  south africa           new zealand

我正在做什么

import pandas as pd
from io import StringIO


data="""a,v,s,f
china,usa,china and uk,france
india,australia,usa,uk
japan,south africa,japan,new zealand"""

df= pd.read_csv(StringIO(data).decode('UTF-8') )


from collections import Counter
def trans(x):
    d=[y for y in x]
    i=0
    while i<len(d):
        j=i+1
        item=d[i]
        while j<len(d):
            if item in d[j]:
                d[j]=d[j].replace(item,'')
            j+=1
        i+=1
    return d

print df.apply(lambda x:trans(x),axis=1 )

只要我将数据输入变量＆＃39;数据＆＃39;它就可以正常工作。但是如果我想通过data = pd.read_csv("trial.csv")从csv文件导入它，它就不起作用了。我收到一条错误消息'DataFrame' object has no attribute 'decode'。如何使用pandas从CSV文件读取数据并将输出写入CSV文件？我哪里错了？

使用pandas读取和写入CSV文件

0 个答案: