如何从python3的每一行中读取起始N个单词

时间:2019-03-24 14:17:31

标签: python-3.x pandas

我正在读取一列中有自由文本的excel。现在从熊猫中读取该文件后,我想限制具有文本的列从每一行开始只能读取N个单词。我尝试了一切,但未能成功。

data [“ text”] =我正在上学,并且从市场上买了东西。

但是我只想读5个凝视的单词。这样看起来就像下面一样。

data [“ text”] =我要去学校。

我希望执行相同的操作,以鞠躬每一行作为data [“ text”]列。

我们将非常感谢您的帮助。

2 个答案:

答案 0 :(得分:2)

$

然后,应用功能:

def first_k(s: str, k=5) -> str:
    s = str(s)  # just in case something like NaN tries to sneak in there
    first_words = s.split()[:k]
    return ' '.join(first_words)

答案 1 :(得分:0)

data["text"] = [' '.join(s.split(' ')[:5]) for s in data["text"].values]