将pandas数据框转换为系列

时间:2015-10-20 21:05:48

标签: python pandas dataframe series

我对熊猫有点新鲜。我有一个1行乘23列的pandas数据框。

我想把它转换成一个系列?我想知道最狡猾的方式是什么?

我已经尝试了ValueError: cannot copy sequence with size 23 to array axis with dimension 1,但它抱怨counter。要理解它仍然是数学术语中的“载体”,这还不够智能。

谢谢!

7 个答案:

答案 0 :(得分:37)

  

它不够聪明,无法意识到它仍然是一个"矢量"用数学术语来说。

更确切地说,它足够聪明,可以识别维度的差异。 : - )

我认为您可以做的最简单的事情是使用iloc在位置上选择该行,这会为您提供一个系列,其中列为新索引,值为值:

>>> df = pd.DataFrame([list(range(5))], columns=["a{}".format(i) for i in range(5)])
>>> df
   a0  a1  a2  a3  a4
0   0   1   2   3   4
>>> df.iloc[0]
a0    0
a1    1
a2    2
a3    3
a4    4
Name: 0, dtype: int64
>>> type(_)
<class 'pandas.core.series.Series'>

答案 1 :(得分:32)

您可以转置单行数据框(仍然会生成数据框),然后squeeze将结果转换为一系列(to_frame的反转)。

df = pd.DataFrame([list(range(5))], columns=["a{}".format(i) for i in range(5)])

>>> df.T.squeeze()  # Or more simply, df.squeeze() for a single row dataframe.
a0    0
a1    1
a2    2
a3    3
a4    4
Name: 0, dtype: int64

注意:为了适应@IanS提出的观点(即使它不在OP的问题中),请测试数据帧的大小。我假设df是一个数据帧,但边缘情况是空数据帧,形状(1,1)的数据帧,以及具有多行的数据帧,在这种情况下,使用应实现其所需的功能

if df.empty:
    # Empty dataframe, so convert to empty Series.
    result = pd.Series()
elif df.shape == (1, 1)
    # DataFrame with one value, so convert to series with appropriate index.
    result = pd.Series(df.iat[0, 0], index=df.columns)
elif len(df) == 1:
    # Convert to series per OP's question.
    result = df.T.squeeze()
else:
    # Dataframe with multiple rows.  Implement desired behavior.
    pass

这也可以根据@themachinist提供的答案进行简化。

if len(df) > 1:
    # Dataframe with multiple rows.  Implement desired behavior.
    pass
else:
    result = pd.Series() if df.empty else df.iloc[0, :]

答案 2 :(得分:22)

您可以使用以下两种方法之一切片数据框来检索系列:

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.iloc.html http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html

import pandas as pd
import numpy as np
df = pd.DataFrame(data=np.random.randn(1,8))

series1=df.iloc[0,:]
type(series1)
pandas.core.series.Series

答案 3 :(得分:4)

您还可以使用stack()

df= DataFrame([list(range(5))], columns = [“a{}”.format(I) for I in range(5)])

在您运行df之后,请运行:

df.stack()

您获得了系列数据框

答案 4 :(得分:2)

如果您有一个单列数据框 df,您可以将其转换为一个系列:

df.iloc[:,0]  # pandas Series

由于您有一个单行数据框 df,您可以将其转置,因此您处于前一种情况:

df.T.iloc[:,0]

答案 5 :(得分:0)

另一种方式-

假设myResult是包含1列和23行形式的数据的dataFrame

// label your columns by passing a list of names
myResult.columns = ['firstCol']

// fetch the column in this way, which will return you a series
myResult = myResult['firstCol']

print(type(myResult))

以类似的方式,您可以从具有多个列的Dataframe中获得序列。

答案 6 :(得分:0)

data = pd.DataFrame({"a":[1,2,3,34],"b":[5,6,7,8]})
new_data = pd.melt(data)
new_data.set_index("variable", inplace=True)

这将给出一个索引为数据的列的数据框,并且所有数据都出现在“值”列中