所以我正在使用Python和Twitter API,使用Tweepy和Twitter的Stream API,它实时返回Tweet对象。查询不同API的应用程序的一部分在推文文本中与URL不匹配,因此我使用Python re
模块将其替换为无害的标识符字符串。但是,我无法找到需要从文本中解析的网址。我决定使用API提供的内容并在文本中进行“查找和替换”,而不是自己在URL中搜索文本。
Here is关于API给我的文档。它提供了一个t.co网址,一个显示网址和一个完全展开的网址。使用t.co url的问题是,twiter不会自动将推文中的所有网址转换为t.co,只会超过一定长度。这意味着t.co网址并不总是与推文文本中显示的网址相同。
所以我需要弄清楚如何从API获取实际出现在推文文本中的URL版本。
谢谢! evamvid
答案 0 :(得分:1)
尝试将此用于extended_url
:
tweet_url = str(tweet.expanded_url) # you might not need str(),
#test it yourself if you'd like.
# Replace tweet by the loop/function you have the json extracted with
tweet_url = tweet_url.replace('\\', '')
print(tweet_url)
那你应该按照你想要的方式给你链接。