我按如下方式创建数据框(我使用的是PyCharm和Python 3.6):
import pandas as pd
data1=pd.read_csv('LoanDataReport_jan_thru_may.txt', sep='|',
low_memory=False)
data2=pd.read_csv('LoanDataReport_jun_thru_sep.txt', sep='|',
low_memory=False)
data3=pd.read_csv('LoanDataReport_oct_thru_dec.txt', sep='|',
low_memory=False)
datafinal=pd.concat([data1,data2,data3])
print(datafinal)
按预期运行并显示数据最终的一部分。
然后,我注释掉了我刚刚使用#运行的代码行,并添加了一行新代码来获取dtypes。它看起来像这样:
#import pandas as pd
#
#data1=pd.read_csv('LoanDataReport_jan_thru_may.txt', sep='|',
# low_memory=False)
#
#data2=pd.read_csv('LoanDataReport_jun_thru_sep.txt', sep='|',
# low_memory=False)
#
#data3=pd.read_csv('LoanDataReport_oct_thru_dec.txt', sep='|',
# low_memory=False)
#
#datafinal=pd.concat([data1,data2,data3])
#
#print(datafinal)
#
print(datafinal.dtypes)
我收到以下错误: /Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6“/ Users / myname / Desktop / Python3 / Import Data.py” Traceback(最近一次调用最后一次): 文件“/ Users / myname / Desktop / Python3 / Import Data.py”,第17行,in 打印(datafinal.dtypes) NameError:名称'datafinal'未定义
使用退出代码1完成处理
为什么会发生这种情况?为什么我不能继续在datafinal上工作而不用每天运行整个代码?所有帮助都非常受欢迎。
答案 0 :(得分:0)
我建议您阅读Python中的variables and scope。
您有一个独立的脚本,您可以在其中定义全局变量datafinal
。该变量仅在脚本生命周期内可见,并且在第一次和第二次尝试之间不会保留。当您第二次运行脚本时,在对除最后一个语句之外的所有语句进行注释之后,您将尝试访问不存在的变量。
如果您想逐步浏览数据,请查看Jupyter Notebook。获得它的一种方法是使用Anaconda Python发布。