我正在清理一些Twitter API数据,而我正在寻找一个字符串的实例。在这种情况下,大数据'用一个例子。但是我的错误说我需要整数而不是字符串。
这很奇怪,因为我正在查看' Text'是字符串而不是整数。我需要它们成为字符串,以便我可以搜索我正在寻找的文本的实例。
DataSet.head()
tweetID Text coordinates followerCount friendsCount Location Name Lang screenName createdAt timeZone
0 1514313588 #Analytics #Jobs: #Data Scientist @ https://t.... None 760 2029 None claap en goCLAAP Thu Jun 13 20:06:03 +0000 2013 None
1 3161843418 RT @asokan_telecom: How 2 Manage Sucessful #Bi... None 564 0 None RA Fisher en dataproblems Sat Apr 18 04:15:08 +0000 2015 None
2 95143217 Sensors & big-data analytics measure &... None 422 306 Singapore Stacey Albert en StaceyGAlbert Mon Dec 07 05:32:49 +0000 2009 Singapore
3 3319297545 RT @BurtchWorks: Looking for a Data Scientist ... None 165 161 Evanston, IL emazeMe Evanston en eMazingEvanston Thu Jun 11 17:59:22 +0000 2015 None
4 26489112 Upcoming webinar: Interactive Business Intelli... None 1276 1677 North America/EMEA Perficient Life Sci en Perficient_LS Wed Mar 25 12:50:21 +0000 2009 Central Time (US & Canada)
我试图从" Text"中提取字符串实例。专栏:
tweets['big data'] = DataSet['Text'].str.contains(r'big data', na=False)
但是我收到了这个错误:
TypeError: list indices must be integers, not str
但这没有意义,我需要将此列作为字符串来查找字符串的实例。
我在这里缺少什么?
答案 0 :(得分:0)
感谢AntonProtopopov解决了这个问题。我没有正确命名我的dataFrame。
DataSet['big data'] = DataSet['Text'].str.contains(r'big data', na=False)