Question

我有以下数据集：

   for data in all_geneva_data:
            url = '/geneva/' +str(data.id) + '/'

我现在要做的是将标签类别转换为像这样的

df = pd.DataFrame([['Tree', 1], ['Tree, Hug']], columns=('Tag', 'ticketID'))

然而，这给了我

df = df[['Tag']]
tags = df.values

我正在寻找

[['Tree']
 ['Tree, Hug']]

关于如何让这个工作的任何想法？

Answer 1

url(r'^view_item/(?P<item_id>\w+)', 'view_item', name="view_item"),

小心>>> import pandas as pd >>> df = pd.DataFrame([['Tree', 1], ['Tree, Hug']], columns=('Tag', 'ticketID')) >>> [ x.split(', ') for row in df[['Tag']].values for x in row ] [['Tree'], ['Tree', 'Hug']]电话。由于原始字符串有空格，因此必须在此处拆分split。

Answer 2

要保留Pandas中的所有内容，您可以使用Tag遍历apply列并使用tolist转换

df.Tag.apply(lambda x: [s.strip() for s in x.split(',')]).tolist()

[['Tree'], ['Tree', 'Hug']]

将pandas数据帧转换为numpy值

2 个答案: