Python将不同的变量分配给类对象

时间:2020-06-29 18:19:03

标签: python python-3.x pandas oop object

这是一个通用的python问题。是否可以将不同的变量分配给类对象,然后对这些变量执行不同的操作集?我正在尝试减少代码,但也许这不是它的工作方式。例如,我正在尝试执行以下操作:

编辑:这是类和方法的摘要:

class Class:
    def __init__(self, df):
        self.df = df

    def query(self, query):
        self.df = self.df.query(query)
        return self

    def fill(self, filter):
        self.df.update(df.filter(like=filter).mask(lambda x: x == 0).ffill(1))
        return self

    def diff(self, cols=None, axis=1):
        diff = self.df[self.df.columns[~self.df.columns.isin(cols)]].diff(axis=axis)
        self.df = diff.join(self.df[self.df.columns.difference(diff.columns)])
        return self

    def melt(self, cols, var=None, value=None):
        return pd.melt(self.df, id_vars=columns, var_name=var, value_name=value)

我正在尝试像这样使用它:

df = pd.read_csv('data.csv')

df = Class(df)
df = df.query(query).forward_fill(include)

df_1 = df.diff(cols).melt(cols)

df_2 = df.melt(cols)

df_1df_2应该具有不同的值,但是它们与df_1相同。如果我使用这样的类,则可以解决此问题:

df_1 = pd.read_csv('data.csv')
df_2 = pd.read_csv('data.csv')

df_1 = Class(df_1)
df_2 = Class(df_2)

df_1 = df_1.query(query).forward_fill(include)
df_2 = df_2.query(query).forward_fill(include)

df_1 = df_1.diff(cols).melt(cols)

df_2 = df_2.melt(cols)

这将导致额外的代码。有没有更好的方法可以在不同的变量上使用不同的对象,或者如果我试图让两个变量执行单独的操作并返回不同的值,我是否必须创建单独的对象?

1 个答案:

答案 0 :(得分:1)

通过return self-方法中的diff语句,您将返回对象的引用。在melt方法之后,也会发生同样的事情。但是在这两种方法中,您都可以操纵原点df

这里:

1 df = pd.read_csv('data.csv')
2
3 df = Class(df)
4 df = df.query(query).forward_fill(include)
5 
6 df_1 = df.diff(cols).melt(cols)

dfdf_1具有相同的值。我猜没有其他参数的melt方法,然后cols参数只分配col名称或类似的名称。随后df_2=df.melt(cols)将具有与df_2=df_1.melt(cols)相同的结果。

如果要使用一个对象,则不要在类方法中使用self.df=...,因为这会更改df的实例值。您只需要写df = ... ,然后返回Class(df)

例如:

def diff(self, cols=None, axis=1):
    diff = self.df[self.df.columns[~self.df.columns.isin(cols)]].diff(axis=axis)
    df = diff.join(self.df[self.df.columns.difference(diff.columns)])
    return Class(df)

最诚挚的问候