我需要一些指导和/或帮助!我有一个数据帧,每行都有一个独特的观察。有一个变量具有嵌套列表的外观作为观察但实际上是一个字符串。
例如:
Var1
[X, Y, [Z, A, B]]
[A, [R,S,T]]
[B]
我需要的是附加一个变量/系列,其中包含该列表中项目数的计数。例如:
Var2:
5
4
1
值是字符串,我需要计数而不是总和。嵌套列表是无关紧要的,用逗号分隔的每个项目都被认为是1个计数。
非常感谢!我不知道我是否正在搜索错误的术语,但是每当我做一个长度语句(无论我是否使用for循环),我都会得到字符的长度,而不是项目的长度。
ETA:意识到它实际上是观察的字符串。
答案 0 :(得分:0)
您可以使用np.hstack
list(map(lambda x :len(np.hstack(x)),df.Var1))
Out[10]: [5, 4, 1]
df['Var2']=list(map(lambda x :len(np.hstack(x)),df.Var1))
df
Out[12]:
Var1 Var2
0 [X, Y, [Z, A, B]] 5
1 [A, [R, S, T]] 4
2 [B] 1