在Python中读取特定的Excel单元格数据

时间:2019-12-24 19:12:41

标签: python excel pandas

我的pandas数据框中有一列,其中每一行都有一个带有多个换行符的字符串。我试图仅使用最后两个换行符来创建新列。单元具有不同数量的换行符。

是否有一个功能可以让我在Excel中专门拉出最后两个换行符?

以下是我的尝试失败。

text= df['Column_Name'].str.rsplit('\r\n', 3)

2 个答案:

答案 0 :(得分:0)

以任何所需的方式读取每一行,然后可以通过换行将其拆分并使用lineArray [-2:]

lines = file.readlines()
for line in lines:
    lineSplitted = line.split('\n')
    print(lineSplitted[-2:])

答案 1 :(得分:0)

我ḿ不确定您要寻找的是什么,但是可能会有帮助:

df = pd.DataFrame({'Column_Name': ['line 1\nline 2\nline 3\nline 4\nline 5',
                                   'line 6\nline 7\nline 8']})
linebreaks = 3

df['linebreaks'] = ['\n'.join(x[1].to_list()) for x in\
                    df.Column_Name.str.split('\n', expand=False)\
                    .explode().groupby(level=0).tail(linebreaks).groupby(level=0)]

print(df)

结果:

                              Column_Name              linebreaks
0  line 1\nline 2\nline 3\nline 4\nline 5  line 3\nline 4\nline 5
1                  line 6\nline 7\nline 8  line 6\nline 7\nline 8