使用pandas

时间:2017-02-17 08:04:27

标签: python excel

我正在尝试读取excel文件并过滤excel文件中的数据。例如

excel data

我想用Python阅读这篇文章。此外,我想过滤Python中直接从excel获取的数据。例如,我想为苹果定义范围并将它们分类为" best"和#34;最糟糕的"。可以说,3岁以下的苹果最差"以上5是最好的"。

有谁知道我该怎么做?

2 个答案:

答案 0 :(得分:0)

这就是你需要的:

import numpy as np
import pandas as pd

df = pd.read_excel(filename) #read file
df = pd.DataFrame({'Apples':np.random.randint(0,10,size=10)}) #for demo
df['Apples_cat'] = (pd.cut(df['Apples'],bins=[-np.inf,2,5,np.inf],labels=['worst','ok','best']))
print(df)

输出:(因为df是在演示中随机生成的,输出会有点差异)

   Apples Apples_cat
0       2      worst
1       2      worst
2       5         ok
3       2      worst
4       1      worst
5       5         ok
6       5         ok
7       6       best
8       4         ok
9       2      worst

答案 1 :(得分:0)

你可以做到

import pandas as pd

data = pd.read_excel ('fruits.xls')

data['apple_category'] = "medium"

data.loc[data['Apples'] < 3, 'apple_category'] = "worst"
data.loc[data['Apples'] > 5, 'apple_category'] = "best"