Question

我有一个if循环，我正在尝试;

（1）从文件路径创建数据帧。

（2）格式化此数据框

（3）将该数据帧添加到作为类实例属性的字典中。

这是我定义类和方法的代码：

class myClass:
    def __init__(self, name, filepathlist):
        self.name = name
        self.filepathlist = filepathlist

    def formatData(self):
        i = 0
        self.dataframeDict = {}
        if i < (len(self.filepathlist) - 1):
            DFRAW = pd.read_csv(self.filepathlist[i], header = 9) #Row 9 is the row that is not blank (all blank auto-skipped)
            DFRAW['DateTime'], DFRAW['dummycol1'] = DFRAW['    ;W;W;W;W'].str.split(';', 1).str
            DFRAW['Col1'], DFRAW['dummycol2'] = DFRAW['dummycol1'].str.split(';', 1).str
            DFRAW['Col2'], DFRAW['dummycol3'] = DFRAW['dummycol2'].str.split(';', 1).str
            DFRAW['Col3'], DFRAW['Col4'] = DFRAW['dummycol3'].str.split(';', 1).str
            DFRAW = DFRAW.drop(['    ;W;W;W;W', 'dummycol1', 'dummycol2', 'dummycol3'], axis = 1)

            dictIndex = self.filepathlist[i][39:44]

            self.dataframeDict.update({dictIndex: DFRAW})
            i = i + 1

然后我创建了一个类的实例并运行方法：

filepathlist = ['filepath1','filepath2']
myINST = myClass('Mydataname', filepathlist)
myINST.formatData()

然后我希望myINST.dataframeDict根据2个输入文件路径有两个数据帧，因此if循环有2次迭代。但是只有1个存在。

我的代码或方法有什么错误？

Answer 1

您需要将条件更改为for i in range(len(self.filepathlist)):

（另外，删除i的分配，因为for循环会自动执行此操作。出于同样的原因，您还应删除增加i}的行。

Answer 2

很难判断这是否能完全解决您的问题，因为没有提供虚拟数据。但是，如果将if i < (len(self.filepathlist) - 1):替换为while i < (len(self.filepathlist) - 1):，您将更接近解决方案。

您目前只是在检查i=0是否小于len(self.filepathlist)-1。如果是，那么if-block将被执行一次。您实际需要的是一个循环，只要i小于len(self.filepathlist)-1，就会继续迭代。这是通过while - 循环完成的。

Answer 3

如果您想使用while循环，请将if行更改为while i < len(self.filepathlist):。

请注意，没有-1。这是因为您使用<代替<=。如果您想使用-1，那么您还需要<=，因为这将确保循环运行正确的次数。

添加到if循环中的字典

3 个答案: