我有一个熊猫数据框,其中包含1亿条推文。
我从数据中提取了URL,目前将其作为列表存储在pandas列中: Dataframe
我想对这些URL进行分析(例如按域名排序,找出发布了哪些域的用户类型)。
是否可以这样存储: Custom
其中URL列是具有动态大小的熊猫系列,因此我可以轻松处理?否则,在应用熊猫操作和速度时,存储URL以提高效率的最佳方法是什么?
答案 0 :(得分:0)
是的,如果您使用\n
连接字符串,例如'url1 \ nurl2 \ nurl3'
如果您有网址列表,则可以使用join:
listurl = ['url1','url2','url3']
print('\n'.join(listurl))