我想对多个数据集执行相同的操作。如何使我的代码可重用?
我已经将一些代码分组在函数中,但是我应该如何将所有函数集成到类或某物中,以便每次读取DataFrame时都只需要调用函数
答案 0 :(得分:0)
我不确定您的确切意思,但是,我有一个要导入的数据。每次导入时,我都希望运行相同的预处理步骤,包括冗长的清理,数据转换等。
您可以这样做:
def clean_data():
pass
def transform_data():
pass
def import_data():
data = clean_data(data)
data = transform_data(data)
data = import_data(data)
如果更有意义,也可以将其转换为类。
您还询问了如何在不同文件中使用它们。假设此脚本称为“ data_import.py”。
然后我们可以通过简单的操作将其用于其他脚本(在同一文件夹中)
import data_import
data_import.import_data(data)
或
from data_import import *
import_data(data)
如果在另一个文件夹中,则必须在data_import.py所在的同一文件夹中添加名为__init__.py的空白文件。