Question

我有两个csv文件：androiddata.csv和iphonedata.csv

我必须执行以下操作：

a）计算美国（服务器国家）的android设备的平均下载速度（download_kbps）。

b）计算台湾（服务器国家）的iPhone的平均下载速度（download_kbps）。

我不知所措，因为我不知道如何有条件地提取美国或台湾。

理想情况下，我认为：

iPhoneData= pd.read_csv("C:/Users/Hanna/Desktop/Sheridan College/Statistics for Data Science/Assignment1/iphone_data_sample.csv")

然后：

count = 0
for row in iPhoneData:
     if (row.server_country == "US"):
         count += row.download_kbps

然后，我用除以我们的选择数得到平均值。

但是该代码不起作用/不存在

我只是不知道如何用熊猫来做到这一点。我好开心地迷路了。

Answer 1

您可以利用Pandas loc来获取满足条件的行：

dUS= iPhoneData.loc[iPhoneData["server_country"]=="US","download_kbps"]
avg_US = dUS.mean()

台湾也可以进行类似的程序。