读入除第一列之外的pandas数据框

时间:2016-04-09 00:24:40

标签: python python-3.x pandas

在读取文本文件到pandas数据框时,我该怎么做才能排除第一列并读取它

目前正在使用的代码:

dframe_main =pd.read_table('/Users/ankit/Desktop/input.txt',sep =',')

2 个答案:

答案 0 :(得分:3)

在您阅读之后删除该列是否足够?这在功能上与从读取中排除第一列相同。这是一个玩具示例:

import numpy as np
import pandas as pd
data = np.array([[1,2,3,4,5], [2,2,2,2,2], [3,3,3,3,3], [4,4,3,4,4], [7,2,3,4,5]])
columns = ["one", "two", "three", "four", "five"]
dframe_main = pd.DataFrame(data=data, columns=columns)
print "All columns:"
print dframe_main
del dframe_main[dframe_main.columns[0]] # get rid of the first column
print "All columns except the first:"
print dframe_main

输出是:

All columns:
   one  two  three  four  five
0    1    2      3     4     5
1    2    2      2     2     2
2    3    3      3     3     3
3    4    4      3     4     4
4    5    2      3     4     5

All columns except the first:
   two  three  four  five
0    2      3     4     5
1    2      2     2     2
2    3      3     3     3
3    4      3     4     4
4    2      3     4     5

答案 1 :(得分:3)

我建议使用usecols参数:

  

usecols :类似数组,默认无返回列的子集。

     

导致更快的解析时间和更低的内存使用量。

假设您的文件有5列:

In [32]: list(range(5))[1:]
Out[32]: [1, 2, 3, 4]

dframe_main = pd.read_table('/Users/ankit/Desktop/input.txt', usecols=list(range(5))[1:])