标签: python pandas
特别是,当我通过串联两个Pandas Series对象创建DataFrame时,Python会创建一个新的内存位置并存储该系列的副本吗?还是只是创建对这两个系列的引用?
如果只是引用,那么修改series.name = "new_name"之类的系列会影响DataFrame的列名吗?
series.name = "new_name"
还要从series = df['column_name']这样的DataFrame中获取序列花费O(1)时间还是O(n)时间?
series = df['column_name']
答案 0 :(得分:1)
一个快速测试表明,成本是连带的,而不是取消引用的。因此,BLUF,df ['s1']为O(1),而concat为O(n)。
从每个系列中的单个项目到每个系列中的4000万个项目,取消引用花费的时间相似,而持续时间似乎线性增加。
使用以下简单代码: def func(frange):
&
结果是: