Question

我是python的新手，我想根据现有变量中的值创建新变量，前提是它们与给定列表中的值匹配，例如下面的示例。

df1["Fruits"] = np.where(df1["Record1"].isin(Fruits), "yes", "no")

如何不仅一次检查一个变量，还一次检查多个变量，而不是是/否将第一个现有变量的值放到新变量中？

类似的东西：

df1["Fruits"] = np.where(df1["Record1" “Record2” “Record3”].isin(Fruits), "ValueOfFirstHit", "no")

如何始终根据相同的一组现有变量（记录1，记录2，记录3）创建多个新变量，但又检查不同的列表（例如水果，蔬菜，面包等）。我已经有这些列表了。有没有办法为新变量赋予相应列表的名称？

最后，我希望有一个如下表所示的df。

 *Existing variables           //   New variables

 Record1  / Record2 / Record3  // Fruits  / Vegetables / Breads

 Apple    / Orange  / Tomato   // Apple   / Tomato     / No

 Tomato   / salad   / baguette // No      / Tomato     / Baguette

 orange   / banana  / apple    // Orange  / No         / No*

在实际情况下，大约有100条记录列，具有10亿个观察值，并且根据感兴趣的结果，可以列出几十到数百个列表。

非常感谢您。

如何基于python df中的一组现有变量和列表创建多个新变量

0 个答案: