我刚刚开始学习Python并使用熊猫进行数据分析,我想知道打开.dat文件的正确方法是什么,以及将.dat转换为.csv并使用此文件扩展名是否更好?
我试图通过简单输入来打开文件
df_topex = open('datasets/TOPEX.dat', 'r')
print(df_topex)
我得到以下信息:
<_io.TextIOWrapper name='datasets/TOPEX.dat' mode='r' encoding='UTF-8'>
尝试时:
df_topex = pd.read_csv('datasets/TOPEX.dat')
df_topex
第一行数据被视为标头。在此特定的数据文件中,没有标题,因此我希望避免这种情况。有没有一种简单的方法可以说这个特定文件没有标题,或者我应该创建它们?如果可以,怎么办?
答案 0 :(得分:3)
只需设置header=None
df_topex = pd.read_csv('datasets/TOPEX.dat', header=None)
df_topex
答案 1 :(得分:1)
我的经验是,pd.read_csv
在尝试导入.dat文件时不起作用,因此您也可以考虑使用:
topex = np.fromfile('datasets/TOPEX.dat')
然后将其转换为数据框:
df_topex = pd.DataFrame(data=x)