Question

我有一个数据集，其中有一列包含个人姓名。我试图根据每个名称是否包含某些字符串来创建一些虚拟变量。我有这些字符串的列表，并且已经提取了names列作为pandas系列。我正在尝试以下代码，但无法使for循环正常工作。有人能请我指出我所犯的错误吗？

import pandas as pd
ds = pd.read_csv('address to .csv')
names = ds['name']
list = ['n1', 'n2', ...]
for l in list:
    l = names.str.contains(l, regex=False)

更新：在亚历山大发表评论之后，我尝试了以下循环，但仍然无法正常工作。

import pandas as pd
ds = pd.read_csv('address to .csv')
names = ds['name']
list = ['n1', 'n2', ...]
for i, l in enumerate(list):
    v_i = names.str.contains(l, regex=False)

Answer 1

您可以使用字典来定义和使用新变量，逻辑将如下所示：

list = ['n1', 'n2', ...]
var_dict = dict()
for l in list:
    var_dict[l] = names.str.contains(l, regex=False)

For循环无法创建熊猫系列

1 个答案: