我有一个数据工程程序,该程序正在从联邦政府网站中获取一些数据并进行转换。对于是否需要使用'self'关键字还是完全不使用类是一种更好的做法,我有些困惑。目前是这样组织的:
class GetGovtData():
def get_data_1(arg1=0, arg2=1):
df = conduct_some_operations
return df
def get_data_2(arg1=4, arg2=5):
df = conduct_some_operations_two
return df
我主要是出于组织目的使用类。例如,可能需要从一个类中使用十二种不同的方法。我觉得从美学上来说更令人满意/更容易输入:
from data.get_govt_data import GetGovtData
df1 = GetGovtData.get_data_1()
df2 = GetGovtData.get_data_2()
而不是:
from data import get_govt_data
df1 = get_govt_data.get_data_1()
df2 = get_govt_data.get_data_2()
只有下划线的那些。所以我很好奇,如果不打扰“自我”,使用这样的类是否会被认为是不好的代码?还是应该删除类并在文件中使用一堆函数呢?
答案 0 :(得分:5)
如果您在Python类中开发函数,则可以通过两种方式定义函数:一种以self作为第一个参数,另一种不使用self。
那么,两者有什么区别?
第一个是方法,它能够访问所创建对象中的内容。这使您可以访问单个对象的内部状态,例如某种类型的计数器。这些是使用面向对象编程时通常使用的方法。简短的介绍可以是基金here [External Link]。这些方法要求您创建给定类的新实例。
在不初始化类实例的情况下起作用。这就是为什么您可以在导入的类上直接调用它们的原因。
这基于Tom K的评论。除了使用self之外,您还可以使用修饰符@staticmethod
来指示方法在类中的作用。可以找到更多信息here [External link]。
要回答您最初的问题:您不需要使用self
。在您的情况下,您不需要自我,因为您不共享对象的内部状态。但是,如果您使用类,则应考虑面向对象的设计。
答案 1 :(得分:2)
我想您有一个名为data/get_govt_data.py
的文件,其中包含您的第一个代码块。您可以将文件重命名为data/GetGovtData.py
,删除class
行,并且完全不必理会类。那你可以做
from data import GetGovtData
df1 = GetGovtData.get_data_1()
根据您的设置,您可能需要为Python创建一个空文件data/__init__.py
才能将data
视为一个模块。
编辑:关于文件命名,Python在这里没有施加任何太严格的限制。但是请注意,许多项目通常都使用camelCase或CapitalCase来区分功能,类和模块名称。对模块使用CapitalCase可能会使其他人困惑一秒钟,以为它是类。如果您不想在项目中使用类,则可以选择不遵循此约定。
答案 2 :(得分:1)
首先要回答标题中的问题:确切的字符串“ self”是一个约定(我看不出没有任何有效的理由忽略BTW),但是类方法中的第一个参数始终将是对类实例。
您应该使用类还是平面函数取决于函数是否具有共享状态。从您的方案看来,它们可能具有通用的基本URL,身份验证数据,数据库名称等。也许您甚至需要先建立连接?所有这些最好放在类中,然后在函数中使用。