Tweepy。在python pandas dataframe中存储tweet文本

时间:2017-02-15 14:12:05

标签: python pandas tweepy

我正在关注一个在线教程(http://adilmoujahid.com/posts/2014/07/twitter-analytics/),尽管编写了相同的python脚本,但我仍陷入困境。我并不擅长python,并且很难理解地图上的文档(在教程中使用)。现在我得到“valueError无法设置没有定义索引的帧和无法转换为系列的值”并且无法找到修复。我的印象是数据框将有3列。一个包含所有推文,一个包含提及facebook的推文,另一个包含提及微软的所有推文。我也意识到这个教程已经两年了,所以可能有一些语言被弃用了?任何帮助表示赞赏

import json 
import pandas as pd 
import re 

tweets_data_path = "Desktop/twit_dat/tweet1.txt"
tweets_data = []

tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
    try:
        tweet = json.loads(line)
        tweets_data.append(tweet) 
    except:
        continue


tweets = pd.DataFrame()


tweets['text'] = map(lambda tweet: tweet['text'], tweets_data)
tweets['Facebook'] = tweets['text'].apply(lambda tweet: word_in_text('Facebook', tweet))
tweets['Microsoft'] = tweets['text'].apply(lambda tweet: word_in_text('Microsoft', tweet))



def word_in_text(word,text):
     if text == None:
        return False
     word = word.lower()
     text = text.lower() 
     match = re.search(word,text)
     if match:
        return True
     else:
        return False

以下是我使用的数据示例: http://charon.kean.edu/~jonathan/exampledata.txt

1 个答案:

答案 0 :(得分:1)

也许你的熊猫版本较低。我复制代码并在我的编译器上正常工作。看看这是否有用。
https://github.com/pandas-dev/pandas/issues/5632
- 这更像是一个评论,但我不具备这种特权 - 。