Question

我有一个充满Twitter数据的数据框。列为：

因此，对于每个推文，我在数据帧中都有行ID，推文的内容，其中使用的提及（例如：“ @ foo”）作为字符串数组以及我根据推文的内容。

一行示例为：

所以我需要做的是以下三种方法：

如果有人可以帮助解决这个问题，或者只是将我指向正确的方向，那就太好了。

Answer 1

让我们致电您的DataFrame df。

对于第一个任务，您使用：

result = df[(Dataframe(df['mentions'].tolist()) == '@foo').any(1)]

在这里，Dataframe(df['mentions'])创建了一个新的DataFrame，其中每一列都是一个提及，每一行都是一条推文。

然后== '@foo'生成一个包含True的布尔数据框，其中提到的是'@foo'。

最后.any(1)返回一个布尔索引，如果该行中的任何元素为True，则该元素为True。

我认为，借助这种帮助，您可以自己解决其余的问题。