Question

我有一个熊猫数据框，其中包含1亿条推文。

我从数据中提取了URL，目前将其作为列表存储在pandas列中： Dataframe

我想对这些URL进行分析（例如按域名排序，找出发布了哪些域的用户类型）。

是否可以这样存储： Custom

其中URL列是具有动态大小的熊猫系列，因此我可以轻松处理？否则，在应用熊猫操作和速度时，存储URL以提高效率的最佳方法是什么？

Answer 1

是的，如果您使用\n连接字符串，例如'url1 \ nurl2 \ nurl3'

如果您有网址列表，则可以使用join：

listurl = ['url1','url2','url3']
print('\n'.join(listurl))