Question

我正在读取一列中有自由文本的excel。现在从熊猫中读取该文件后，我想限制具有文本的列从每一行开始只能读取N个单词。我尝试了一切，但未能成功。

data [“ text”] =我正在上学，并且从市场上买了东西。

但是我只想读5个凝视的单词。这样看起来就像下面一样。

data [“ text”] =我要去学校。

我希望执行相同的操作，以鞠躬每一行作为data [“ text”]列。

我们将非常感谢您的帮助。

Answer 1

然后，应用功能：

def first_k(s: str, k=5) -> str:
    s = str(s)  # just in case something like NaN tries to sneak in there
    first_words = s.split()[:k]
    return ' '.join(first_words)

Answer 2

data["text"] = [' '.join(s.split(' ')[:5]) for s in data["text"].values]

如何从python3的每一行中读取起始N个单词

2 个答案: