我有一个if循环,我正在尝试;
(1)从文件路径创建数据帧。
(2)格式化此数据框
(3)将该数据帧添加到作为类实例属性的字典中。
这是我定义类和方法的代码:
class myClass:
def __init__(self, name, filepathlist):
self.name = name
self.filepathlist = filepathlist
def formatData(self):
i = 0
self.dataframeDict = {}
if i < (len(self.filepathlist) - 1):
DFRAW = pd.read_csv(self.filepathlist[i], header = 9) #Row 9 is the row that is not blank (all blank auto-skipped)
DFRAW['DateTime'], DFRAW['dummycol1'] = DFRAW[' ;W;W;W;W'].str.split(';', 1).str
DFRAW['Col1'], DFRAW['dummycol2'] = DFRAW['dummycol1'].str.split(';', 1).str
DFRAW['Col2'], DFRAW['dummycol3'] = DFRAW['dummycol2'].str.split(';', 1).str
DFRAW['Col3'], DFRAW['Col4'] = DFRAW['dummycol3'].str.split(';', 1).str
DFRAW = DFRAW.drop([' ;W;W;W;W', 'dummycol1', 'dummycol2', 'dummycol3'], axis = 1)
dictIndex = self.filepathlist[i][39:44]
self.dataframeDict.update({dictIndex: DFRAW})
i = i + 1
然后我创建了一个类的实例并运行方法:
filepathlist = ['filepath1','filepath2']
myINST = myClass('Mydataname', filepathlist)
myINST.formatData()
然后我希望myINST.dataframeDict
根据2个输入文件路径有两个数据帧,因此if循环有2次迭代。但是只有1个存在。
我的代码或方法有什么错误?
答案 0 :(得分:1)
您需要将条件更改为for i in range(len(self.filepathlist)):
(另外,删除i
的分配,因为for
循环会自动执行此操作。出于同样的原因,您还应删除增加i
}的行。
答案 1 :(得分:1)
很难判断这是否能完全解决您的问题,因为没有提供虚拟数据。但是,如果将if i < (len(self.filepathlist) - 1):
替换为while i < (len(self.filepathlist) - 1):
,您将更接近解决方案。
您目前只是在检查i=0
是否小于len(self.filepathlist)-1
。如果是,那么if-block将被执行一次。您实际需要的是一个循环,只要i
小于len(self.filepathlist)-1
,就会继续迭代。这是通过while
- 循环完成的。
答案 2 :(得分:0)
如果您想使用while
循环,请将if
行更改为while i < len(self.filepathlist):
。
请注意,没有-1
。这是因为您使用<
代替<=
。如果您想使用-1
,那么您还需要<=
,因为这将确保循环运行正确的次数。