Question

我有一个数据工程程序，该程序正在从联邦政府网站中获取一些数据并进行转换。对于是否需要使用'self'关键字还是完全不使用类是一种更好的做法，我有些困惑。目前是这样组织的：

class GetGovtData():

    def get_data_1(arg1=0, arg2=1):
       df = conduct_some_operations
       return df

    def get_data_2(arg1=4, arg2=5):
       df = conduct_some_operations_two
       return df

我主要是出于组织目的使用类。例如，可能需要从一个类中使用十二种不同的方法。我觉得从美学上来说更令人满意/更容易输入：

from data.get_govt_data import GetGovtData

df1 = GetGovtData.get_data_1()
df2 = GetGovtData.get_data_2()

而不是：

from data import get_govt_data

df1 = get_govt_data.get_data_1()
df2 = get_govt_data.get_data_2()

只有下划线的那些。所以我很好奇，如果不打扰“自我”，使用这样的类是否会被认为是不好的代码？还是应该删除类并在文件中使用一堆函数呢？

Answer 1

如果您在Python类中开发函数，则可以通过两种方式定义函数：一种以self作为第一个参数，另一种不使用self。

那么，两者有什么区别？

具有自我的功能

第一个是方法，它能够访问所创建对象中的内容。这使您可以访问单个对象的内部状态，例如某种类型的计数器。这些是使用面向对象编程时通常使用的方法。简短的介绍可以是基金here [External Link]。这些方法要求您创建给定类的新实例。

没有自我的功能

在不初始化类实例的情况下起作用。这就是为什么您可以在导入的类上直接调用它们的原因。

替代解决方案

这基于Tom K的评论。除了使用self之外，您还可以使用修饰符@staticmethod来指示方法在类中的作用。可以找到更多信息here [External link]。

最终思想

要回答您最初的问题：您不需要使用self。在您的情况下，您不需要自我，因为您不共享对象的内部状态。但是，如果您使用类，则应考虑面向对象的设计。

Answer 2

我想您有一个名为data/get_govt_data.py的文件，其中包含您的第一个代码块。您可以将文件重命名为data/GetGovtData.py，删除class行，并且完全不必理会类。那你可以做

from data import GetGovtData

df1 = GetGovtData.get_data_1()

根据您的设置，您可能需要为Python创建一个空文件data/__init__.py才能将data视为一个模块。

编辑：关于文件命名，Python在这里没有施加任何太严格的限制。但是请注意，许多项目通常都使用camelCase或CapitalCase来区分功能，类和模块名称。对模块使用CapitalCase可能会使其他人困惑一秒钟，以为它是类。如果您不想在项目中使用类，则可以选择不遵循此约定。

Answer 3

首先要回答标题中的问题：确切的字符串“ self”是一个约定（我看不出没有任何有效的理由忽略BTW），但是类方法中的第一个参数始终将是对类实例。

您应该使用类还是平面函数取决于函数是否具有共享状态。从您的方案看来，它们可能具有通用的基本URL，身份验证数据，数据库名称等。也许您甚至需要先建立连接？所有这些最好放在类中，然后在函数中使用。

类与函数：如果在Python中使用类，是否需要使用'self'关键字？

3 个答案:

具有自我的功能

没有自我的功能

替代解决方案

最终思想