如何以最佳方式获得一系列不同类型数据的频率?
示例:
Series : [1,2,3],(3,4,5),[8,9],[7],(6,7),0.78
系列的类型是对象
输出:
list : 3
tuple : 2
float : 1
答案 0 :(得分:4)
您可以使用apply(type)
来获取类型,然后调用series.value_counts()
:
l=[[1,2,3],(3,4,5),[8,9],[7],(6,7),0.78]
s=pd.Series(l)
s.apply(type).value_counts()
<class 'list'> 3
<class 'tuple'> 2
<class 'float'> 1
答案 1 :(得分:1)
temp = StringIO("""
[1,2,3]
(3,4,5)
[8,9]
[7]
(6,7)
0.78""")
df = pd.read_csv(temp, sep='|', engine='python', header=None)
df[0].apply(lambda x: type(eval(x))).value_counts()
输出
<class 'list'> 3
<class 'tuple'> 2
<class 'float'> 1
Name: 0, dtype: int64
答案 2 :(得分:0)
from collections import defaultdict
import pandas as pd
res = defaultdict(int)
ser = pd.Series([[1,2,3],(3,4,5),[8,9],[7],(6,7),0.78])
for i in ser:
res[type(i)]+=1
for k,v in res.items():
print('{} {}'.format(k,v))
输出
<class 'list'> 3
<class 'tuple'> 2
<class 'float'> 1