如何在python(类型为unicode)中逐行操作文本段落?

时间:2013-03-12 08:32:50

标签: python string beautifulsoup

我有一个变量(类型为unicode),其中包含一些文本。我从另一个类型为' bs4.element.Tag'(美丽的汤)的变量中获取本文。

此变量中的文本示例为:

1234字的话

1234 words1 words2

我试图做的是逐行操作这个文本,所以我将每一行修剪成两部分:一行包含前四个字符,即1234,另一部分只包含文本。

此致

1 个答案:

答案 0 :(得分:0)

你可能正在寻找像'split()'或'splitline()'这样的方法(取决于你的变量)。

这将是:

    var.split() # if you want to split using the space
    # or
    var[:4] # if you are sure that you need the first 4 characters.