修改

Question

我正在尝试阅读pandas中的this .txt文件，这是我的result。我天真地想（昨天晚上我得到了这个东西，但我显然错了。如果我只是运行

rebull = pd.read_table('rebull.txt',sep=' ')

它有效，但它给我的结果带有无序的NaN数组我假设从最初的.txt中的分色 RESULT

Answer 1

尝试skipinitialspace：

In [26]: pd.read_table('test.txt', sep=' ', skipinitialspace=True)
Out[26]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385 
Data columns (total 7 columns):
Mon          386  non-null values
id           386  non-null values
NA           386  non-null values
alpha_K24    386  non-null values
class        386  non-null values
alpha_K8     386  non-null values
class.1      0  non-null values
dtypes: float64(3), object(4)

修改

很抱歉误解了您的问题。我认为您可以阅读@DSM提到的表格，并设置列名称

In [55]: pd.read_table('test.txt', sep=r"\s\s+", header=None, skiprows=[0], names=['Mon id', 'Na', 'alpha_K24', 'class', 'alpha_8', 'class'])
Out[55]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385
Data columns (total 6 columns):
Mon id       386  non-null values
Na           386  non-null values
alpha_K24    386  non-null values
class        386  non-null values
alpha_8      386  non-null values
class        386  non-null values
dtypes: float64(2), object(4)

请注意，您可以将第二个class设置为另一个名称。或者您将按df['class']

获得两列

Answer 2

找出我的问题...如有必要，请务必确认您的索引是否用连字符连接。特别是我在第一栏中的“Mon id”是我的问题......应该是'Mon-id'。

有问题读取.csv文件python-pandas

2 个答案:

修改