我认为我有一个相对简单的问题,但无法找到解决编码问题的合适答案。
我有一个字符串的pandas列:
df1['tweet'].head(1)
0 besides food,
Name: tweet
我需要提取文本并将其推送到这种格式的Python str对象中:
test_messages = ["line1",
"line2",
"etc"]
目标是对一组推文进行分类,因此相信输入:X_test = tfidf.transform(test_messages)
是一个str对象。
答案 0 :(得分:2)
使用list
将系列(列)转换为python列表:
list(df1["tweet"])
答案 1 :(得分:-1)
获取系列head()
,然后访问第一个值:
df1['tweet'].head(1).item()
或:使用Series tolist()
方法,然后切片第0个元素:
df.height.tolist()
[94, 170]
df.height.tolist()[0]
94
(请注意,Python索引基于0,但是head()
基于1)