如何基于python df中的一组现有变量和列表创建多个新变量

时间:2019-02-23 11:43:41

标签: python pandas numpy

我是python的新手,我想根据现有变量中的值创建新变量,前提是它们与给定列表中的值匹配,例如下面的示例。

df1["Fruits"] = np.where(df1["Record1"].isin(Fruits), "yes", "no")

如何不仅一次检查一个变量,还一次检查多个变量,而不是是/否将第一个现有变量的值放到新变量中?

类似的东西:

df1["Fruits"] = np.where(df1["Record1" “Record2” “Record3”].isin(Fruits), "ValueOfFirstHit", "no")

如何始终根据相同的一组现有变量(记录1,记录2,记录3)创建多个新变量,但又检查不同的列表(例如水果,蔬菜,面包等)。我已经有这些列表了。有没有办法为新变量赋予相应列表的名称?

最后,我希望有一个如下表所示的df。

 *Existing variables           //   New variables

 Record1  / Record2 / Record3  // Fruits  / Vegetables / Breads

 Apple    / Orange  / Tomato   // Apple   / Tomato     / No

 Tomato   / salad   / baguette // No      / Tomato     / Baguette

 orange   / banana  / apple    // Orange  / No         / No*

在实际情况下,大约有100条记录列,具有10亿个观察值,并且根据感兴趣的结果,可以列出几十到数百个列表。

非常感谢您。

0 个答案:

没有答案