将奇怪的文本文件导入Pandas DataFrame

时间:2017-10-25 02:28:08

标签: python pandas dataframe import genfromtxt

我在将奇怪格式化的文本文件导入Pandas DataFrame时遇到了很多麻烦 - 或者根本就没有。以下是文本文件的前几行:

 Name        RA       Dec  B      vh   sig  Type   D1  D2
00006-0211 000032.0 -021129 14.3  7323  31   4X   1.3 0.8
00006+2142 000035.6  214054 14.4  6605  32   5  P 1.0 0.7
N7814      000041.1  155203 12.0  1050   4   2A s 6.5 2.7
00010+2256 000101.2  225519 14.0  7301  34   5    1.9 1.0
N7816      000115.2  071203 14.0  5241   5   4    2.0 2.0
N7817      000124.9  202818 12.7  2309   5   4A   4.0 1.1
N7819      000150.3  311138 14.3  4953  10   3B s 2.0 1.8
N7820      000156.7  045513 13.9  3064  19   0    1.6 0.7
N7824      000232.2  063833 14.5  6134  28   2    1.9 1.3
0003+1955  000345.1  195527 14.0  7730  19  -6    0.3 0.3
N   1      000441.3  272550 13.4  4534   6   3A s 1.8 1.2
00056+2644 000535.3  264331 14.4  8741  36   3    1.0 .55
N  12      000610.9  042005 14.5  3941   4   4B R 2.0 1.7

我认为'姓名'专栏真的把一切都扔了。我能够完美地导入' B'列使用:

import pandas as pd

df1 = pd.read_fwf('cfa1.txt', skiprows=11, header=None, names['GARBAGE', 'B', 'vh', 'sig', 'Type', 'D1', 'D2'])
df2 = df1[['B', 'vh', 'sig', 'Type', 'D1', 'D2']]
df2.head()

其中GARBAGE是没有正确导入的垃圾。

我也尝试过:

df = pd.read_table('cfa1.txt', skiprows=11, header=None, names=['Name', 'RA', 'Dec', 'B', 'vh', 'sig', 'Type', 'D1', 'D2'])
df.head()

哪个不起作用。 (我还有很多失败的尝试,我认为这些尝试都不值得包括)。提前感谢您的时间和考虑!

0 个答案:

没有答案