将pandas数据帧转换为numpy值

时间:2017-01-31 17:05:11

标签: python pandas numpy

我有以下数据集:

   for data in all_geneva_data:
            url = '/geneva/' +str(data.id) + '/'

我现在要做的是将标签类别转换为像这样的

df = pd.DataFrame([['Tree', 1], ['Tree, Hug']], columns=('Tag', 'ticketID'))

然而,这给了我

df = df[['Tag']]
tags = df.values

我正在寻找

[['Tree']
 ['Tree, Hug']]

关于如何让这个工作的任何想法?

2 个答案:

答案 0 :(得分:1)

url(r'^view_item/(?P<item_id>\w+)', 'view_item', name="view_item"), 

小心>>> import pandas as pd >>> df = pd.DataFrame([['Tree', 1], ['Tree, Hug']], columns=('Tag', 'ticketID')) >>> [ x.split(', ') for row in df[['Tag']].values for x in row ] [['Tree'], ['Tree', 'Hug']] 电话。由于原始字符串有空格,因此必须在此处拆分split

答案 1 :(得分:0)

要保留Pandas中的所有内容,您可以使用Tag遍历apply列并使用tolist转换

df.Tag.apply(lambda x: [s.strip() for s in x.split(',')]).tolist()

[['Tree'], ['Tree', 'Hug']]