我正在使用jupyter笔记本进行新的数据分析项目,我对笔记本电脑单元的顺序感到困惑。
我首先导入pandas并将csv文件作为数据读取,所以我的第一个单元格如下:
In [1]:
import pandas as pd
data = pd.read_csv('thanksgiving.csv', encoding='Latin-1')
print(data.head(5))
我想打印出数据帧的列名:
In [2]:
data.columns
然后我意识到在第一个单元格中,我应该使用data.head(5)而不是print(data.head(5)),因为print函数不会以正确的格式打印数据帧。
所以我回到第一个单元格,修改并再次执行它。然后它改变自: 在[1]到In [3]中。这两个单元现在看起来像:
In [3]: ......
In [2]: ......
更具体地说,细胞的顺序混乱了。 我担心这会让我的项目的读者感到困惑。在这个问题上是否有一个被广泛接受的规定?或者我只需要特别注意避免在开始时重新运行细胞?
答案 0 :(得分:1)
Jupyter笔记本只是这样工作。
如果您修改了笔记本中的任何单元格,则还必须重新运行其后续单元格。这将使细胞再次升序。
在您的示例中,当单元格看起来像这样时,由于某些前面单元格中的某些更改,应该再次执行编号为2的单元格。
In [3]: ......
In [2]: ......
运行单元格2后,笔记本将如下所示。
In [3]: ......
In [4]: ......