如何将列表元素附加到pandas系列中的每一行?

时间:2017-03-26 15:09:52

标签: python pandas string-concatenation series

我有以下pandas系列,其中每一行都是一个没有空格的长字符串。它的形状为(250,)(即有250行)

import pandas as pd
sr1 = pd.Series(...)

                                                     0  
0    abdcadbcadcbadacbadbdddddacbadcbadadbcadbcadad...  
1    cacacdacadbdcadcabdcbadcbadbdabcabdbbbbbacdbac...  
2    bbbbbcadcacddabcadbcdabcbaddcbadcbadbcadbcaaba...  
3    acdbcdacdbadbadcbdbaaaacbdacadbacaddcabdacbdab...  
....

我有一个包含250个字符串的列表,我想将它们附加到每行的开头。

list_of_strings = ["prefix1", "prefix2", "prefix3", ...., "prefix250"]

如何将list_of_strings中的每个元素附加到sr1中的相应行?生成的系列应如下所示:

                                                    0  
0    prefix1    abdcadbcadcbadacbadbdddddacbadcbadadbcadbcadad...  
1    prefix2    cacacdacadbdcadcabdcbadcbadbdabcabdbbbbbacdbac...  
2    prefix3    bbbbbcadcacddabcadbcdabcbaddcbadcbadbcadbcaaba...  
3    prefix4    acdbcdacdbadbadcbdbaaaacbdacadbacaddcabdacbdab...  
....

我的第一个想法是尝试类似的事情:

sr1.insert(0, "prefixes", value = list_of_strings)

但这会引发错误AttributeError: 'Series' object has no attribute 'insert'。可以将sr1转换为带有sr1 = sr1.to_frame()的pandas DataFrame,而之前的.insert()将导致带有两列的DataFrame。

在python中,我们可以使用指定的分隔符连接字符串,如下所示:

first = "firstword"
second = "secondword"
combined = "    ".join([first, second])
## outputs 'firstword    secondword'

我不确定熊猫系列是怎么回事。也许.apply(' '.join)不知何故?

4 个答案:

答案 0 :(得分:1)

您需要先从Series创建list,然后添加双add+ - 一个用于空白,另一个用于s

s = pd.Series(['a','b','c'])
list_of_strings = ["prefix1", "prefix2", "prefix3"]

print (pd.Series(list_of_strings, index=s.index).add(' ').add(s))
#same as
#print (pd.Series(list_of_strings, index=s.index)+ ' ' + s)
0    prefix1 a
1    prefix2 b
2    prefix3 c
dtype: object

cat的另一个解决方案:

print (pd.Series(list_of_strings, index=s.index).str.cat(s, sep=' '))
0    prefix1 a
1    prefix2 b
2    prefix3 c
dtype: object

解决方案apply,但需要DataFrame - 构造函数或concat

print (pd.DataFrame({'prefix':list_of_strings, 'vals':s}).apply(' '.join, axis=1))
0    prefix1 a
1    prefix2 b
2    prefix3 c
dtype: object
print (pd.concat([pd.Series(list_of_strings, index=s.index), s], axis=1)
         .apply(' '.join, axis=1))
0    prefix1 a
1    prefix2 b
2    prefix3 c
dtype: object

答案 1 :(得分:1)

使用+运算符,它将自动连接字符串。

pd.Series(list_of_strings) + "    " + sr1

答案 2 :(得分:1)

您可以制作一系列前缀,然后将两个系列加在一起:

import pandas as pd

s1 = pd.Series(['a'*10,'b'*10,'c'*10])

s1
# returns:
# 0    aaaaaaaaaa
# 1    bbbbbbbbbb
# 2    cccccccccc


s2 = pd.Series(['pre1', 'pre2', 'pre3'])

s2+s1
# returns:
# 0    pre1aaaaaaaaaa
# 1    pre2bbbbbbbbbb
# 2    pre3cccccccccc

答案 3 :(得分:1)

如何将前缀列表转换为长度为250的系列,然后添加它们。

sr0 = pd.Series(list_of_strings)
sr1 = sr0 + sr1