我正在尝试阅读pandas中的this .txt文件,这是我的result。我天真地想(昨天晚上我得到了这个东西,但我显然错了。如果我只是运行
rebull = pd.read_table('rebull.txt',sep=' ')
它有效,但它给我的结果带有无序的NaN数组我假设从最初的.txt中的分色 RESULT
答案 0 :(得分:2)
In [26]: pd.read_table('test.txt', sep=' ', skipinitialspace=True)
Out[26]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385
Data columns (total 7 columns):
Mon 386 non-null values
id 386 non-null values
NA 386 non-null values
alpha_K24 386 non-null values
class 386 non-null values
alpha_K8 386 non-null values
class.1 0 non-null values
dtypes: float64(3), object(4)
很抱歉误解了您的问题。我认为您可以阅读@DSM提到的表格,并设置列名称
In [55]: pd.read_table('test.txt', sep=r"\s\s+", header=None, skiprows=[0], names=['Mon id', 'Na', 'alpha_K24', 'class', 'alpha_8', 'class'])
Out[55]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385
Data columns (total 6 columns):
Mon id 386 non-null values
Na 386 non-null values
alpha_K24 386 non-null values
class 386 non-null values
alpha_8 386 non-null values
class 386 non-null values
dtypes: float64(2), object(4)
请注意,您可以将第二个class
设置为另一个名称。或者您将按df['class']
答案 1 :(得分:0)
找出我的问题...如有必要,请务必确认您的索引是否用连字符连接。特别是我在第一栏中的“Mon id”是我的问题......应该是'Mon-id'。