我有一个零售数据集,我正在尝试使用“ dfply”包下的mutate函数在其中创建一个新列。
数据集是一个名为“ data”的数据框,而我尝试创建的列名为“ date_diff”(日期之间的差异),我尝试在Jupyter笔记本中运行以下代码:
(data >>
mutate(
date_diff=data['InvoiceDate'] - log(data['InvoiceDate'])
))
我期望的结果是将一个名为date_diff的新列添加到现有数据框中,但这是我得到的输出:
TypeError Traceback (most recent call last)
<ipython-input-97-3035c41fde12> in <module>
1 (data >>
2 mutate(
----> 3 date_diff=data['InvoiceDate'] - log(data['InvoiceDate'])
4 ))
TypeError: 'module' object is not subscriptable
我也看到了此错误:TypeError: 'module' object is not subscriptable
以上问题中给出的答案也适用于我的问题吗?还是我的问题需要其他方法?
答案 0 :(得分:1)
您的变量data
不是Pandas DataFrame。检查如何为数据分配data
。