Python熊猫CSV循环

时间:2018-09-23 02:58:04

标签: python pandas csv

我有两个csv文件:androiddata.csv和iphonedata.csv

我必须执行以下操作:

a)计算美国(服务器国家)的android设备的平均下载速度(download_kbps)。

b)计算台湾(服务器国家)的iPhone的平均下载速度(download_kbps)。

我不知所措,因为我不知道如何有条件地提取美国或台湾。

理想情况下,我认为:

iPhoneData= pd.read_csv("C:/Users/Hanna/Desktop/Sheridan College/Statistics for Data Science/Assignment1/iphone_data_sample.csv")

然后:

count = 0
for row in iPhoneData:
     if (row.server_country == "US"):
         count += row.download_kbps

然后,我用除以我们的选择数得到平均值。

但是该代码不起作用/不存在

我只是不知道如何用熊猫来做到这一点。我好开心地迷路了。

1 个答案:

答案 0 :(得分:0)

您可以利用Pandas loc来获取满足条件的行:

dUS= iPhoneData.loc[iPhoneData["server_country"]=="US","download_kbps"]
avg_US = dUS.mean()

台湾也可以进行类似的程序。