我是R用户,但尝试学习Python。 使用R时,运行单个代码导入excel文件并将其保存为数据框后,便能够使用保存在工作空间中的数据框,而不必每次都重新导入。
在使用Python时,我注意到除非使用解释器,否则我只能运行完整的脚本(整个“ foo.py”文件),而不能按代码进行编码。
我想加载excel文件并使用其中的数据。我的代码从将excel文件导入为数据帧开始。因此,每次我添加新代码并想要查看结果时,我都会运行所有py脚本,并且每次运行它都会加载数据。
也许我以错误的方式使用Python。 使用Jupyter笔记本时,我没有这个问题,因为我能够像R一样逐个单元地运行代码。但是我现在正在尝试使用Pycharm。
import pandas as pd
df = pd.read_excel('foo.xlsx', sheet_name = 'sales_data')
print("Column headings:")
print(df.columns)
答案 0 :(得分:1)
Jupyter
逐行运行脚本,并且您拥有变量(包括已加载到内存的数据帧),因此可以使用该变量df
直到退出Jupyter
为止。
像PyCharm
之类的IDE(取决于版本,尤其是社区版)一次运行整个脚本,因此它需要在下次运行时将excel加载到内存中,因为它不会持久存储上一次的任何信息。运行。
Jupyter
是我们所说的REPL,这意味着所有用户信息都是持久的,直到会话被杀死为止,而PyCharm
在评估事物行时一次性运行所有代码。按行,最后给出输出。
答案 1 :(得分:0)
import pandas as pd
def load_file(file_name,sheetname=None):
df = pd.read_excel(file_name, sheet_name =sheetname)
return df
readed_df = load_file('<file-path>',sheetname='<sheet name>')
然后在readed_df
上执行要完成的其余任务。