在pandas列中存储列表的最有效方法是什么?

时间:2019-03-05 05:17:36

标签: pandas dataframe twitter

我有一个熊猫数据框,其中包含1亿条推文。

我从数据中提取了URL,目前将其作为列表存储在pandas列中: Dataframe

我想对这些URL进行分析(例如按域名排序,找出发布了哪些域的用户类型)。

是否可以这样存储: Custom

其中URL列是具有动态大小的熊猫系列,因此我可以轻松处理?否则,在应用熊猫操作和速度时,存储URL以提高效率的最佳方法是什么?

1 个答案:

答案 0 :(得分:0)

是的,如果您使用\n连接字符串,例如'url1 \ nurl2 \ nurl3'

如果您有网址列表,则可以使用join:

listurl = ['url1','url2','url3']
print('\n'.join(listurl))