有问题读取.csv文件python-pandas

时间:2013-05-16 20:00:44

标签: python pandas

我正在尝试阅读pandas中的this .txt文件,这是我的result。我天真地想(昨天晚上我得到了这个东西,但我显然错了。如果我只是运行

rebull = pd.read_table('rebull.txt',sep=' ')

它有效,但它给我的结果带有无序的NaN数组我假设从最初的.txt中的分色 RESULT

2 个答案:

答案 0 :(得分:2)

尝试skipinitialspace

In [26]: pd.read_table('test.txt', sep=' ', skipinitialspace=True)
Out[26]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385 
Data columns (total 7 columns):
Mon          386  non-null values
id           386  non-null values
NA           386  non-null values
alpha_K24    386  non-null values
class        386  non-null values
alpha_K8     386  non-null values
class.1      0  non-null values
dtypes: float64(3), object(4)

修改

很抱歉误解了您的问题。我认为您可以阅读@DSM提到的表格,并设置列名称

In [55]: pd.read_table('test.txt', sep=r"\s\s+", header=None, skiprows=[0], names=['Mon id', 'Na', 'alpha_K24', 'class', 'alpha_8', 'class'])
Out[55]:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 386 entries, 0 to 385
Data columns (total 6 columns):
Mon id       386  non-null values
Na           386  non-null values
alpha_K24    386  non-null values
class        386  non-null values
alpha_8      386  non-null values
class        386  non-null values
dtypes: float64(2), object(4)

请注意,您可以将第二个class设置为另一个名称。或者您将按df['class']

获得两列

答案 1 :(得分:0)

找出我的问题...如有必要,请务必确认您的索引是否用连字符连接。特别是我在第一栏中的“Mon id”是我的问题......应该是'Mon-id'。