假设我有一个名为Groceries的数据集。库存具有商店中食品的条形码及其库存类型。我将其作为数据框加载到大熊猫中,我想创建特定库存类型的所有物品的条形码列表,以便随后可以使用条形码从其他数据框中识别信息。
使用熊猫最有效的方法是什么?
Groceries = {'Stock_type': ['Apple', 'Apple', 'Orange', 'Chicken', 'Orange', 'Chocolate'], 'Bar_Code': [12442, 23534, 53245, 15453, 23453, 13451]}
Groceries_df = pd.DataFrame(data=Groceries)
Groceries_df
Bar_Code Stock_type
0 12442 Apple
1 23534 Apple
2 53245 Orange
3 15453 Chicken
4 23453 Orange
5 13451 Chocolate
本质上,这是我要对其进行分析的另一个较大数据集所遇到的相同问题。我需要从一个数据帧中收集一组唯一的标识元数据,以便可以从其他数据帧中提取这些数据点的值。
答案 0 :(得分:1)
将数据加载到数据框
import pandas as pd
Groceries = {'Stock_type': ['Apple', 'Apple', 'Orange', 'Chicken', 'Orange', 'Chocolate'], 'Bar_Code': [12442, 23534, 53245, 15453, 23453, 13451]}
Groceries_df = pd.DataFrame(Groceries)
所有特定库存类型(例如Apple)的物品的条形码
Groceries_df[Groceries_df['Stock_type']=='Apple']
条形码的Python列表(将一系列条形码转换为列表)
list(Groceries_df[Groceries_df['Stock_type']=='Apple']['Bar_Code'])