Question

在读取文本文件到pandas数据框时，我该怎么做才能排除第一列并读取它

目前正在使用的代码：

dframe_main =pd.read_table('/Users/ankit/Desktop/input.txt',sep =',')

Answer 1

在您阅读之后删除该列是否足够？这在功能上与从读取中排除第一列相同。这是一个玩具示例：

import numpy as np
import pandas as pd
data = np.array([[1,2,3,4,5], [2,2,2,2,2], [3,3,3,3,3], [4,4,3,4,4], [7,2,3,4,5]])
columns = ["one", "two", "three", "four", "five"]
dframe_main = pd.DataFrame(data=data, columns=columns)
print "All columns:"
print dframe_main
del dframe_main[dframe_main.columns[0]] # get rid of the first column
print "All columns except the first:"
print dframe_main

输出是：

All columns:
   one  two  three  four  five
0    1    2      3     4     5
1    2    2      2     2     2
2    3    3      3     3     3
3    4    4      3     4     4
4    5    2      3     4     5

All columns except the first:
   two  three  four  five
0    2      3     4     5
1    2      2     2     2
2    3      3     3     3
3    4      3     4     4
4    2      3     4     5

Answer 2

我建议使用usecols参数：

usecols ：类似数组，默认无返回列的子集。

导致更快的解析时间和更低的内存使用量。

假设您的文件有5列：

In [32]: list(range(5))[1:]
Out[32]: [1, 2, 3, 4]

dframe_main = pd.read_table('/Users/ankit/Desktop/input.txt', usecols=list(range(5))[1:])

读入除第一列之外的pandas数据框

2 个答案: