我有两个csv文件:androiddata.csv和iphonedata.csv
我必须执行以下操作:
a)计算美国(服务器国家)的android设备的平均下载速度(download_kbps)。
b)计算台湾(服务器国家)的iPhone的平均下载速度(download_kbps)。
我不知所措,因为我不知道如何有条件地提取美国或台湾。
理想情况下,我认为:
iPhoneData= pd.read_csv("C:/Users/Hanna/Desktop/Sheridan College/Statistics for Data Science/Assignment1/iphone_data_sample.csv")
然后:
count = 0
for row in iPhoneData:
if (row.server_country == "US"):
count += row.download_kbps
然后,我用除以我们的选择数得到平均值。
但是该代码不起作用/不存在
我只是不知道如何用熊猫来做到这一点。我好开心地迷路了。
答案 0 :(得分:0)
您可以利用Pandas loc来获取满足条件的行:
dUS= iPhoneData.loc[iPhoneData["server_country"]=="US","download_kbps"]
avg_US = dUS.mean()
台湾也可以进行类似的程序。