根据lengt函数从df中的数组中检索值

时间:2018-09-05 18:23:04

标签: python pandas

如何从数据框内的数组中检索前n个值,

其中n是同一数组的长度-1:(len [array]-1)?

要弄清我的目标,是我到目前为止从jupyter笔记本中获得的代码:

import numpy as np
import pandas as pd
#load csv into pandas data frame
df1 = pd.read_csv(r"accounts.csv")
#define the range for clarity
xi = 60
xn = 70
df1['splt_acc'] = df1.Account.str.split('.')
df1['len'] = df1.splt_acc.apply(lambda x: len(x)-1).astype(int)
df1['parent'] = df1.splt_acc.str.join('.')
pd.DataFrame(df1)[xi:xn]

显示以下内容

    Account Rubriek       splt_acc  len parent
60  9.5     Inkoop        [9, 5]    1   9.5
61  9.6     Overige res.. [9, 6]    1   9.6
62  9.7     Buitengewon.. [9, 7]    1   9.7
63  9.8     Incidentele.. [9, 8]    1   9.8
64  9.9     Vennootschap. [9, 9]    1   9.9
65  0.0.0   Terreinen     [0, 0, 0] 2   0.0.0
66  0.0.1   Gebouwen      [0, 0, 1] 2   0.0.1
67  0.0.2   Verbouwingen  [0, 0, 2] 2   0.0.2
68  0.0.3   Machines      [0, 0, 3] 2   0.0.3
69  0.0.4   Gereedschappen[0, 0, 4] 2   0.0.4

接下来我想要的是:

df1['y'] = df1.splt_acc.apply(lambda splt_acc: splt_acc[0:df1.len])
pd.DataFrame(df1)[xi:xn]

这将导致以下错误:切片索引必须为整数或无,或具有 index 方法

使用更简单的方法,我可以获取每行的结果,在本例中为第60行:

account = df1['Account'][60]
x = account.split('.')

if len(x) - 1 == 0:
    y = 'null'
else:
    y = x[0:(len(x)-1)]

print(y)

['9']

if y == 'null':
    parent = 'null'
else:
    parent = ".".join(str(x) for x in y)

print(parent)

9

但是问题是,如何在DataFrame中获得相同的结果?

2 个答案:

答案 0 :(得分:1)

您想做的是

df1['y'] = df1.splt_acc.apply(lambda x: x[:-1])

这意味着您正在获取从0到倒数第二个值之间的所有值。 例如,

a = [5,3,6,4]

然后,a[:-1] returns [5,3,6]

此外,您可以从头开始进行操作

df1['y'] = df1.Account.str.split('.')[:-1]

答案 1 :(得分:1)

df1 = pd.DataFrame({'Account': ['9', '9.5', '9.6', '9.7', '9.8', '9.9', '0.0.0', '0.0.1', '0.0.2', '0.0.3', '0.0.4']})

df1.assign(
    parent=df1['Account'].str.split('.').apply(lambda x: '.'.join(x[:-1]) or 'null'))
>>> df1
   Account parent
0        9   null
1      9.5      9
2      9.6      9
3      9.7      9
4      9.8      9
5      9.9      9
6    0.0.0    0.0
7    0.0.1    0.0
8    0.0.2    0.0
9    0.0.3    0.0
10   0.0.4    0.0