根据熊猫数据框另一列中的值创建变量

时间:2020-11-10 02:35:46

标签: python-3.x pandas tweets

我有一个看起来很简单的问题,但无法解决。

我有一条Tweets的熊猫数据框。用户的位置通过各种方式注册在名为“ Location”的变量中:

记录好位置后,我通常会得到:

{'country_code': 'tr', 'state': 'Central Anatolia Region', 'county': 'Çankaya', 'city': 'Ankara'}

('country_code': 'tr', 'state': 'Black Sea Region', 'city': 'Trabzon'}

但是有时候,我得到的只是:

{'country_code': 'tr'}

('country_code': 'tr', 'state': 'Batman'}

通常,什么都没有,注册的全部是这样:

{}

我想编写一个脚本,可以在我的pandas数据框中为这些单个值创建新变量。换句话说,如果为特定的行注册了country_code,那么我希望将有问题的值记录在名为country_code的变量中。以此类推,适用于州,县和市。如果什么都没有,它可以为所有相关的缺失变量(县,州,城市)输入空白或不适用。

最终结果应该是,根据在“ Location”变量中注册的值(并为它们注册了某物(或什么都没有)),我在数据框中有四个新变量:国家代码,州,县和城市值。

有人可以帮忙吗?

非常感谢您!

1 个答案:

答案 0 :(得分:0)

我能够通过直接使用原始JSON文件来解决此问题。我所做的就是通过使用for和if循环将位置数据存储到我正在寻找的不同类别中,类似于其他人建议的here。我这样做不是要尝试使用熊猫特有的函数将在变量“ Location”中注册的数据存储到数据集中的其他变量中。

相关问题