Question

我认为我有一个相对简单的问题，但无法找到解决编码问题的合适答案。

我有一个字符串的pandas列： df1['tweet'].head(1) 0 besides food, Name: tweet

我需要提取文本并将其推送到这种格式的Python str对象中：

test_messages = ["line1", "line2", "etc"]

目标是对一组推文进行分类，因此相信输入：X_test = tfidf.transform(test_messages)是一个str对象。

Answer 1

使用list将系列（列）转换为python列表：

list(df1["tweet"])

Answer 2

获取系列head()，然后访问第一个值：

df1['tweet'].head(1).item()
或：使用Series tolist()方法，然后切片第0个元素：

df.height.tolist() [94, 170] df.height.tolist()[0] 94

（请注意，Python索引基于0，但是head()基于1）