这是一个通用的python问题。是否可以将不同的变量分配给类对象,然后对这些变量执行不同的操作集?我正在尝试减少代码,但也许这不是它的工作方式。例如,我正在尝试执行以下操作:
编辑:这是类和方法的摘要:
class Class:
def __init__(self, df):
self.df = df
def query(self, query):
self.df = self.df.query(query)
return self
def fill(self, filter):
self.df.update(df.filter(like=filter).mask(lambda x: x == 0).ffill(1))
return self
def diff(self, cols=None, axis=1):
diff = self.df[self.df.columns[~self.df.columns.isin(cols)]].diff(axis=axis)
self.df = diff.join(self.df[self.df.columns.difference(diff.columns)])
return self
def melt(self, cols, var=None, value=None):
return pd.melt(self.df, id_vars=columns, var_name=var, value_name=value)
我正在尝试像这样使用它:
df = pd.read_csv('data.csv')
df = Class(df)
df = df.query(query).forward_fill(include)
df_1 = df.diff(cols).melt(cols)
df_2 = df.melt(cols)
df_1
和df_2
应该具有不同的值,但是它们与df_1
相同。如果我使用这样的类,则可以解决此问题:
df_1 = pd.read_csv('data.csv')
df_2 = pd.read_csv('data.csv')
df_1 = Class(df_1)
df_2 = Class(df_2)
df_1 = df_1.query(query).forward_fill(include)
df_2 = df_2.query(query).forward_fill(include)
df_1 = df_1.diff(cols).melt(cols)
df_2 = df_2.melt(cols)
这将导致额外的代码。有没有更好的方法可以在不同的变量上使用不同的对象,或者如果我试图让两个变量执行单独的操作并返回不同的值,我是否必须创建单独的对象?
答案 0 :(得分:1)
通过return self
-方法中的diff
语句,您将返回对象的引用。在melt
方法之后,也会发生同样的事情。但是在这两种方法中,您都可以操纵原点df
。
这里:
1 df = pd.read_csv('data.csv')
2
3 df = Class(df)
4 df = df.query(query).forward_fill(include)
5
6 df_1 = df.diff(cols).melt(cols)
df
与df_1
具有相同的值。我猜没有其他参数的melt
方法,然后cols参数只分配col名称或类似的名称。随后df_2=df.melt(cols)
将具有与df_2=df_1.melt(cols)
相同的结果。
如果要使用一个对象,则不要在类方法中使用self.df=...
,因为这会更改df
的实例值。您只需要写df = ...
,然后返回Class(df)
。
例如:
def diff(self, cols=None, axis=1):
diff = self.df[self.df.columns[~self.df.columns.isin(cols)]].diff(axis=axis)
df = diff.join(self.df[self.df.columns.difference(diff.columns)])
return Class(df)
最诚挚的问候