我的pandas数据框中有一列,其中每一行都有一个带有多个换行符的字符串。我试图仅使用最后两个换行符来创建新列。单元具有不同数量的换行符。
是否有一个功能可以让我在Excel中专门拉出最后两个换行符?
以下是我的尝试失败。
text= df['Column_Name'].str.rsplit('\r\n', 3)
答案 0 :(得分:0)
以任何所需的方式读取每一行,然后可以通过换行将其拆分并使用lineArray [-2:]
lines = file.readlines()
for line in lines:
lineSplitted = line.split('\n')
print(lineSplitted[-2:])
答案 1 :(得分:0)
我ḿ不确定您要寻找的是什么,但是可能会有帮助:
df = pd.DataFrame({'Column_Name': ['line 1\nline 2\nline 3\nline 4\nline 5',
'line 6\nline 7\nline 8']})
linebreaks = 3
df['linebreaks'] = ['\n'.join(x[1].to_list()) for x in\
df.Column_Name.str.split('\n', expand=False)\
.explode().groupby(level=0).tail(linebreaks).groupby(level=0)]
print(df)
结果:
Column_Name linebreaks
0 line 1\nline 2\nline 3\nline 4\nline 5 line 3\nline 4\nline 5
1 line 6\nline 7\nline 8 line 6\nline 7\nline 8