将python数据帧传递给对象并更改数据帧

时间:2015-12-08 00:26:34

标签: python pandas dataframe

我是python的新手,我试图将一个参数(dataframe)传递给一个函数,并通过读取一个excel文件来更改参数(dataframe)的值。 (假设我已导入所有必要的文件)

我注意到python没有通过引用传递参数,最终我没有初始化/更改数据帧。

我读过python通过object-reference而不是value或reference。但是,我不需要更改相同的数据帧。

输出为:class'pandas.core.frame.DataFrame'>

from pandas import DataFrame as df
class Data:
   x = df

   @staticmethod
   def import_File(df_name , file):
       df_name  = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1', header=0, skiprows=None, skip_footer=0, index_col=None, parse_cols=None, parse_dates=True, date_parser=True, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, engine=None )


def inputdata():
    Data.import_File(Data.x,r"C:\Users\Data\try.xlsx")
    print(Data.x)

2 个答案:

答案 0 :(得分:4)

你似乎在艰难地做了很多事情。我会在符合标准使用模式的同时尝试简化它。

# Whatever imports you need
import pandas as pd


# Static variables and methods should generally be avoided.
# Change class and variable names to whatever is more suitable.
# Names should be meaningful when possible.
class MyData:

    # Load data in constructor. Could easily do this in another method.
    def __init__(self, filename):
        self.data = pd.io.excel.read_excel(filename, sheetname='Sheet1')


def inputData():
    # In my experience, forward slashes work just fine on Windows.
    # Create new MyData object using constructor
    x = MyData('C:/Users/Data/try.xlsx')

    # Access member variable from object
    print(x.data)

这是在方法而不是构造函数中加载的版本。

import pandas as pd


class MyData:

    # Constructor
    def __init__(self):
        # Whatever setup you need
        self.data = None
        self.loaded = False

    # Method with optional argument
    def loadFile(self, filename, sheetname='Sheet1')
        self.data = pd.io.excel.read_excel(filename, sheetname=sheetname)
        self.loaded = True


def inputData():
    x = MyData()
    x.loadFile('C:/Users/Data/try.xlsx')
    print(x.data)

    # load some other data, using sheetname 'Sheet2' instead of default
    y = MyData()
    y.loadFile('C:/Users/Data/tryagain.xlsx', 'Sheet2')
    # can also pass arguments by name in any order like this:
    # y.loadFile(sheetname='Sheet2', filename='C:/Users/Data/tryagain.xlsx')
    print(y.data)

    # x and y both still exist with different data.
    # calling x.loadFile() again with a different path will overwrite its data.

它原始代码中没有保存的原因是因为为参数名称赋值永远不会改变Python中的原始变量。你能做的就是这样:

# Continuing from the last code block

def loadDefault(data):
    data.loadFile('C:/Users/Data/try.xlsx')

def testReference():
    x = MyData()
    loadDefault(x)
    # x.data now has been loaded
    print(x.data)


# Another example

def setIndex0(variable, value):
    variable[0] = value

def testSetIndex0():
    v = ['hello', 'world']
    setIndex0(v, 'Good morning')
    # v[0] now equals 'Good morning'
    print(v[0])

但你不能这样做:

def setString(variable, value):
    # The only thing this changes is the value of variable inside this function.
    variable = value

def testSetString():
    v = 'Start'
    setString(v, 'Finish')
    # v is still 'Start'
    print(v)

如果您希望能够使用名称指定存储值的位置,则可以使用带索引/键的数据结构。字典允许您使用密钥访问和存储值。

import pandas as pd


class MyData:

    # Constructor
    def __init__(self):
        # make data a dictionary
        self.data = {}

    # Method with optional argument
    def loadFile(self, storename, filename, sheetname='Sheet1')
        self.data[storename] = pd.io.excel.read_excel(filename, sheetname=sheetname)

    # Access method
    def getData(self, name):
        return self.data[name]


def inputData():
    x = MyData()
    x.loadFile('name1', 'C:/Users/Data/try.xlsx')
    x.loadFile('name2', 'C:/Users/Data/tryagain.xlsx', 'Sheet2')

    # access Sheet1
    print(x.getData('name1'))

    # access Sheet2
    print(x.getData('name2'))

如果您真的希望该功能是静态的,那么您根本不需要创建一个新类。创建类的主要原因是将其用作可重用的结构,以使用特定于该数据的方法来保存数据。

import pandas as pd

# wrap read_excel to make it easier to use
def loadFile(filename, sheetname='Sheet1'):
    return pd.io.excel.read_excel(filename, sheetname=sheetname)

def inputData():
    x = loadFile('C:/Users/Data/try.xlsx')
    print(x)

    # the above is exactly the same as
    x = pd.io.excel.read_excel('C:/Users/Data/try.xlsx', sheetname='Sheet1')
    print(x)

答案 1 :(得分:2)

在您的代码df中是一个类对象。要创建空数据框,您需要实例化它。 Python中的Instantiating类使用函数表示法。此外,当我们读取excel文件时,我们不需要传递默认参数。这将有助于代码看起来更清晰     此外,当我们读取excel文件时,我们不需要传递默认参数。这将有助于代码看起来更清晰。

from pandas import DataFrame as df
class Data:
    x = df()

    @staticmethod
    def import_File(df_name, file):
        df_name = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1')

当您将Data.x传递给import_File()时,df_name将引用与Data.x相同的对象,在这种情况下,它是一个空数据帧。但是,当您将pd.io.excel.read_excel(file)分配给df_name时,df_name与空数据框之间的连接会中断,而df_name现在会引用Excel数据框。 Data.x在此过程中未经历任何更改,因此它仍然连接到空数据框对象。

使用字符串查看此内容的简单方法:

x = 'red'
df_name = x

我们可以打破字符串对象' red'之间的df_name连接。并使用object' excel`形成一个新的。

df_name = 'excel'
print(x)
'red'

但是,Data.x可以返回excel数据帧的简单修复。

from pandas import DataFrame as df
class Data:
   x = df()

   @staticmethod
   def import_File(file):
       Data.x = pd.io.excel.read_excel(file.replace('"',''), sheetname='Sheet1')

def inputdata():
    Data.import_File(r"C:\Users\Data\try.xlsx")
    print(Data.x)

但是,我不建议使用staticmethods,你应该在你的课程中包含一个构造函数,正如另一个答案所推荐的那样。