我是python的新手,我试图将一个参数(dataframe)传递给一个函数,并通过读取一个excel文件来更改参数(dataframe)的值。 (假设我已导入所有必要的文件)
我注意到python没有通过引用传递参数,最终我没有初始化/更改数据帧。
我读过python通过object-reference而不是value或reference。但是,我不需要更改相同的数据帧。
输出为:class'pandas.core.frame.DataFrame'>
from pandas import DataFrame as df
class Data:
x = df
@staticmethod
def import_File(df_name , file):
df_name = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1', header=0, skiprows=None, skip_footer=0, index_col=None, parse_cols=None, parse_dates=True, date_parser=True, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, engine=None )
def inputdata():
Data.import_File(Data.x,r"C:\Users\Data\try.xlsx")
print(Data.x)
答案 0 :(得分:4)
你似乎在艰难地做了很多事情。我会在符合标准使用模式的同时尝试简化它。
# Whatever imports you need
import pandas as pd
# Static variables and methods should generally be avoided.
# Change class and variable names to whatever is more suitable.
# Names should be meaningful when possible.
class MyData:
# Load data in constructor. Could easily do this in another method.
def __init__(self, filename):
self.data = pd.io.excel.read_excel(filename, sheetname='Sheet1')
def inputData():
# In my experience, forward slashes work just fine on Windows.
# Create new MyData object using constructor
x = MyData('C:/Users/Data/try.xlsx')
# Access member variable from object
print(x.data)
这是在方法而不是构造函数中加载的版本。
import pandas as pd
class MyData:
# Constructor
def __init__(self):
# Whatever setup you need
self.data = None
self.loaded = False
# Method with optional argument
def loadFile(self, filename, sheetname='Sheet1')
self.data = pd.io.excel.read_excel(filename, sheetname=sheetname)
self.loaded = True
def inputData():
x = MyData()
x.loadFile('C:/Users/Data/try.xlsx')
print(x.data)
# load some other data, using sheetname 'Sheet2' instead of default
y = MyData()
y.loadFile('C:/Users/Data/tryagain.xlsx', 'Sheet2')
# can also pass arguments by name in any order like this:
# y.loadFile(sheetname='Sheet2', filename='C:/Users/Data/tryagain.xlsx')
print(y.data)
# x and y both still exist with different data.
# calling x.loadFile() again with a different path will overwrite its data.
它原始代码中没有保存的原因是因为为参数名称赋值永远不会改变Python中的原始变量。你能做的就是这样:
# Continuing from the last code block
def loadDefault(data):
data.loadFile('C:/Users/Data/try.xlsx')
def testReference():
x = MyData()
loadDefault(x)
# x.data now has been loaded
print(x.data)
# Another example
def setIndex0(variable, value):
variable[0] = value
def testSetIndex0():
v = ['hello', 'world']
setIndex0(v, 'Good morning')
# v[0] now equals 'Good morning'
print(v[0])
但你不能这样做:
def setString(variable, value):
# The only thing this changes is the value of variable inside this function.
variable = value
def testSetString():
v = 'Start'
setString(v, 'Finish')
# v is still 'Start'
print(v)
如果您希望能够使用名称指定存储值的位置,则可以使用带索引/键的数据结构。字典允许您使用密钥访问和存储值。
import pandas as pd
class MyData:
# Constructor
def __init__(self):
# make data a dictionary
self.data = {}
# Method with optional argument
def loadFile(self, storename, filename, sheetname='Sheet1')
self.data[storename] = pd.io.excel.read_excel(filename, sheetname=sheetname)
# Access method
def getData(self, name):
return self.data[name]
def inputData():
x = MyData()
x.loadFile('name1', 'C:/Users/Data/try.xlsx')
x.loadFile('name2', 'C:/Users/Data/tryagain.xlsx', 'Sheet2')
# access Sheet1
print(x.getData('name1'))
# access Sheet2
print(x.getData('name2'))
如果您真的希望该功能是静态的,那么您根本不需要创建一个新类。创建类的主要原因是将其用作可重用的结构,以使用特定于该数据的方法来保存数据。
import pandas as pd
# wrap read_excel to make it easier to use
def loadFile(filename, sheetname='Sheet1'):
return pd.io.excel.read_excel(filename, sheetname=sheetname)
def inputData():
x = loadFile('C:/Users/Data/try.xlsx')
print(x)
# the above is exactly the same as
x = pd.io.excel.read_excel('C:/Users/Data/try.xlsx', sheetname='Sheet1')
print(x)
答案 1 :(得分:2)
在您的代码df
中是一个类对象。要创建空数据框,您需要实例化它。 Python中的Instantiating类使用函数表示法。此外,当我们读取excel文件时,我们不需要传递默认参数。这将有助于代码看起来更清晰
此外,当我们读取excel文件时,我们不需要传递默认参数。这将有助于代码看起来更清晰。
from pandas import DataFrame as df
class Data:
x = df()
@staticmethod
def import_File(df_name, file):
df_name = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1')
当您将Data.x
传递给import_File()
时,df_name
将引用与Data.x
相同的对象,在这种情况下,它是一个空数据帧。但是,当您将pd.io.excel.read_excel(file)
分配给df_name
时,df_name
与空数据框之间的连接会中断,而df_name
现在会引用Excel数据框。 Data.x
在此过程中未经历任何更改,因此它仍然连接到空数据框对象。
使用字符串查看此内容的简单方法:
x = 'red'
df_name = x
我们可以打破字符串对象' red'之间的df_name
连接。并使用object' excel`形成一个新的。
df_name = 'excel'
print(x)
'red'
但是,Data.x
可以返回excel数据帧的简单修复。
from pandas import DataFrame as df
class Data:
x = df()
@staticmethod
def import_File(file):
Data.x = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1')
def inputdata():
Data.import_File(r"C:\Users\Data\try.xlsx")
print(Data.x)
但是,我不建议使用staticmethods,你应该在你的课程中包含一个构造函数,正如另一个答案所推荐的那样。