Thinbug
News
isin pandas没有显示数据框中的所有值
时间:2017-02-01 13:05:39
标签:
pandas
numpy
我正在使用亚马逊数据库进行研究,我想选择100个评分最高的项目。所以首先我计算了itemID的值(asin) data = amazon_data_parse(' data / reviews_Movies_and_TV_5.json.gz') unique,counts = np.unique(data [' asin'],return_counts = True) test = np.asarray((unique,counts))。T test.sort(轴= 1) 这使: 数组([[5,' 0005019281'], [5,' 0005119367'], [5,' 0307141985'], ... [1974,' B00LG7VVPO'], [2110,' B00LH9ROKM'], [2213,' B00LT1JHLW']],dtype = object) 很明显,必须至少选择6.000行。但如果我跑: a =测试[49952:50054,1] a = a.tolist() test2 = data [data.asin.isin(a)] 它只从数据集中选择2000行。我已经尝试了多种方法,比如只在一个asin上进行过滤,但它似乎并没有起作用。有人可以帮忙吗?如果有一个更好的选择来获取asin列中包含100个最常值的行的数据帧,我也会很高兴。
1 个答案:
答案 0 :(得分:0)
我找到了解决方案,不得不将排序行更改为:
test = test[test[:,1].argsort()]
相关问题
isin检查列表 - Pandas Dataframe
python pandas isin方法?
将pandas DataFrame query()方法与isin()结合使用
如何使用pandas isin()来测试数据框
isin pandas没有显示数据框中的所有值
更快的方式.isin()提取条件行
pandas isin()函数与列表
Pandas:使用.isin()返回错误:" AttributeError:float'对象没有属性' isin'"
熊猫无法使用重复轴计算isin
将.isin应用于DF中的多个序列
最新问题
我写了这段代码,但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值,但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场?
是否有可能使 loadstring 不可能等于打印?卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用?
在此代码中是否有使用“this”的替代方法?
在 SQL Server 和 PostgreSQL 上查询,我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源?