我有一个数据集,其中有一列包含个人姓名。 我试图根据每个名称是否包含某些字符串来创建一些虚拟变量。我有这些字符串的列表,并且已经提取了names列作为pandas系列。我正在尝试以下代码,但无法使for循环正常工作。有人能请我指出我所犯的错误吗?
import pandas as pd
ds = pd.read_csv('address to .csv')
names = ds['name']
list = ['n1', 'n2', ...]
for l in list:
l = names.str.contains(l, regex=False)
更新:在亚历山大发表评论之后,我尝试了以下循环,但仍然无法正常工作。
import pandas as pd
ds = pd.read_csv('address to .csv')
names = ds['name']
list = ['n1', 'n2', ...]
for i, l in enumerate(list):
v_i = names.str.contains(l, regex=False)
答案 0 :(得分:0)
您可以使用字典来定义和使用新变量,逻辑将如下所示:
list = ['n1', 'n2', ...]
var_dict = dict()
for l in list:
var_dict[l] = names.str.contains(l, regex=False)