我的字符串很长,想要在一定数量的字符后将其分割。我已经做到了:
if len(song.lyrics) > 2048:
string1 = string[:2048]
string2 = string[2049:]
这个问题是,有时它会在文本中间中断,而我不想这样做。有没有一种方法可以在达到字符数限制之前获得最后的换行符并将其中断? 谢谢
答案 0 :(得分:1)
这是否会为您提供所需的结果?如果没有,您能否提供一个示例字符串,该字符串具有预期的输出?
import re
CHARACTER_LIMIT = 2048
for m in re.finditer(r'.{,%s}(?:\n|$)' % CHARACTER_LIMIT, string, re.DOTALL):
print(m.group(0))
答案 1 :(得分:0)
找到换行符 left-of 的长度限制,然后使用它进行分割。
if len(song.lyrics) > 2048:
index = string[:2048].rfind('\n')
string1 = string[:index]
string2 = string[index+1:]
示例:
>>> s = 'aaaaaaa\nbbbbbbbbbbbbbbbb\nccccccc\ndddddddddddddddd'
>>> limit = 31 # ↑
>>> index = s[:limit].rfind('\n')
>>> index
24
>>> s1,s2 = s[:index],s[index+1:]
>>> s1
'aaaaaaa\nbbbbbbbbbbbbbbbb'
>>> s2
'ccccccc\ndddddddddddddddd'
>>>