我正在读取一列中有自由文本的excel。现在从熊猫中读取该文件后,我想限制具有文本的列从每一行开始只能读取N个单词。我尝试了一切,但未能成功。
data [“ text”] =我正在上学,并且从市场上买了东西。
但是我只想读5个凝视的单词。这样看起来就像下面一样。
data [“ text”] =我要去学校。
我希望执行相同的操作,以鞠躬每一行作为data [“ text”]列。
我们将非常感谢您的帮助。
答案 0 :(得分:2)
$
然后,应用功能:
def first_k(s: str, k=5) -> str:
s = str(s) # just in case something like NaN tries to sneak in there
first_words = s.split()[:k]
return ' '.join(first_words)
答案 1 :(得分:0)
data["text"] = [' '.join(s.split(' ')[:5]) for s in data["text"].values]