我有以下pandas系列,其中每一行都是一个没有空格的长字符串。它的形状为(250,)
(即有250行)
import pandas as pd
sr1 = pd.Series(...)
0
0 abdcadbcadcbadacbadbdddddacbadcbadadbcadbcadad...
1 cacacdacadbdcadcabdcbadcbadbdabcabdbbbbbacdbac...
2 bbbbbcadcacddabcadbcdabcbaddcbadcbadbcadbcaaba...
3 acdbcdacdbadbadcbdbaaaacbdacadbacaddcabdacbdab...
....
我有一个包含250个字符串的列表,我想将它们附加到每行的开头。
list_of_strings = ["prefix1", "prefix2", "prefix3", ...., "prefix250"]
如何将list_of_strings
中的每个元素附加到sr1
中的相应行?生成的系列应如下所示:
0
0 prefix1 abdcadbcadcbadacbadbdddddacbadcbadadbcadbcadad...
1 prefix2 cacacdacadbdcadcabdcbadcbadbdabcabdbbbbbacdbac...
2 prefix3 bbbbbcadcacddabcadbcdabcbaddcbadcbadbcadbcaaba...
3 prefix4 acdbcdacdbadbadcbdbaaaacbdacadbacaddcabdacbdab...
....
我的第一个想法是尝试类似的事情:
sr1.insert(0, "prefixes", value = list_of_strings)
但这会引发错误AttributeError: 'Series' object has no attribute 'insert'
。可以将sr1
转换为带有sr1 = sr1.to_frame()
的pandas DataFrame,而之前的.insert()
将导致带有两列的DataFrame。
在python中,我们可以使用指定的分隔符连接字符串,如下所示:
first = "firstword"
second = "secondword"
combined = " ".join([first, second])
## outputs 'firstword secondword'
我不确定熊猫系列是怎么回事。也许.apply(' '.join)
不知何故?
答案 0 :(得分:1)
您需要先从Series
创建list
,然后添加双add
或+
- 一个用于空白,另一个用于s
:
s = pd.Series(['a','b','c'])
list_of_strings = ["prefix1", "prefix2", "prefix3"]
print (pd.Series(list_of_strings, index=s.index).add(' ').add(s))
#same as
#print (pd.Series(list_of_strings, index=s.index)+ ' ' + s)
0 prefix1 a
1 prefix2 b
2 prefix3 c
dtype: object
cat
的另一个解决方案:
print (pd.Series(list_of_strings, index=s.index).str.cat(s, sep=' '))
0 prefix1 a
1 prefix2 b
2 prefix3 c
dtype: object
解决方案apply
,但需要DataFrame
- 构造函数或concat
:
print (pd.DataFrame({'prefix':list_of_strings, 'vals':s}).apply(' '.join, axis=1))
0 prefix1 a
1 prefix2 b
2 prefix3 c
dtype: object
print (pd.concat([pd.Series(list_of_strings, index=s.index), s], axis=1)
.apply(' '.join, axis=1))
0 prefix1 a
1 prefix2 b
2 prefix3 c
dtype: object
答案 1 :(得分:1)
使用+运算符,它将自动连接字符串。
pd.Series(list_of_strings) + " " + sr1
答案 2 :(得分:1)
您可以制作一系列前缀,然后将两个系列加在一起:
import pandas as pd
s1 = pd.Series(['a'*10,'b'*10,'c'*10])
s1
# returns:
# 0 aaaaaaaaaa
# 1 bbbbbbbbbb
# 2 cccccccccc
s2 = pd.Series(['pre1', 'pre2', 'pre3'])
s2+s1
# returns:
# 0 pre1aaaaaaaaaa
# 1 pre2bbbbbbbbbb
# 2 pre3cccccccccc
答案 3 :(得分:1)
如何将前缀列表转换为长度为250的系列,然后添加它们。
sr0 = pd.Series(list_of_strings)
sr1 = sr0 + sr1