我是python的新手,我想根据现有变量中的值创建新变量,前提是它们与给定列表中的值匹配,例如下面的示例。
df1["Fruits"] = np.where(df1["Record1"].isin(Fruits), "yes", "no")
如何不仅一次检查一个变量,还一次检查多个变量,而不是是/否将第一个现有变量的值放到新变量中?
类似的东西:
df1["Fruits"] = np.where(df1["Record1" “Record2” “Record3”].isin(Fruits), "ValueOfFirstHit", "no")
如何始终根据相同的一组现有变量(记录1,记录2,记录3)创建多个新变量,但又检查不同的列表(例如水果,蔬菜,面包等)。我已经有这些列表了。有没有办法为新变量赋予相应列表的名称?
最后,我希望有一个如下表所示的df。
*Existing variables // New variables
Record1 / Record2 / Record3 // Fruits / Vegetables / Breads
Apple / Orange / Tomato // Apple / Tomato / No
Tomato / salad / baguette // No / Tomato / Baguette
orange / banana / apple // Orange / No / No*
在实际情况下,大约有100条记录列,具有10亿个观察值,并且根据感兴趣的结果,可以列出几十到数百个列表。
非常感谢您。