我可能会被这个问题所淹没,但到目前为止,我一直无法解决这个问题。我有一个看起来像这样的DataFrame:
Hits Last visit Bandwidth IsWeird
Host
vocms241.cern.ch 3777 2013-11-28 16:03:00 27554 False
ekpsquid.physik.uni-karlsruhe.de 4132 2013-11-28 14:54:00 99235 True
ec-slc6-x86-64-spi-4.cern.ch 949 2013-11-28 02:04:00 1004236 False
ec-slc6-x86-64-spi-3.cern.ch 949 2013-11-28 02:37:00 1004544 False
ec-slc6-x86-64-spi-2.cern.ch 949 2013-11-28 02:01:00 1004103 False
所以你看,DataFrame的索引是一个字符串。现在,我有一个函数get_something
,它将索引中的主机映射到另一个字符串,我想将结果添加为新列:
Hits Last visit Bandwidth IsWeird NewField
Host
vocms241.cern.ch 3777 2013-11-28 16:03:00 27554 False STRING-0-0-1
ekpsquid.physik.uni-karlsruhe.de 4132 2013-11-28 14:54:00 99235 True AnotherDifferentString
ec-slc6-x86-64-spi-4.cern.ch 949 2013-11-28 02:04:00 1004236 False No_String_here
ec-slc6-x86-64-spi-3.cern.ch 949 2013-11-28 02:37:00 1004544 False None
ec-slc6-x86-64-spi-2.cern.ch 949 2013-11-28 02:01:00 1004103 False I_dont-Know-what_else
我目前实现这一目标的复杂方法是:(假设DataFrame为df
,pandas导入为pd
):
_temp = pd.DataFrame(df.reset_index()['Host'])
_temp['NewField'] = _temp.Host.apply(get_something)
_temp.set_index('Host', inplace=True)
df = pd.merge(df, _temp, left_index=True, right_index=True)
但我无法相信需要那么多代码来实现这一点。
答案 0 :(得分:2)
可能是这样的吗?
df['NewField'] = pd.Series(df.index).apply(get_something)
答案 1 :(得分:0)
在处理了其他一些事情并多次回到这个问题之后,我已经采取了一种不太复杂的方式:
df['NewField'] = df.index # Copy the contents of
# the index to a new column.
df['NewField'] = df['NewField'].apply(get_something) # Apply the function