我们可以使用pandas执行删除操作而无需读取文件

时间:2018-06-07 15:40:13

标签: mysql python-2.7 pandas

我们可以在不读取文件的情况下对csv文件或sql表进行操作,即不使用read_csv或read_sql_table。

基本上我有一个非常大的文件,需要比较两个文件或表并删除公共行。

import pandas as pd

colnames=['email']

data= pd.read_csv("sample",names=colnames, header=None)

data1=pd.read_csv("sample1",names=colnames,header=None)

filter=data[~data['email'].isin(data1)]

我一直这样做,但是当我读csv文件时,它需要花费很多时间。 那么有没有其他方法来执行此操作,就像我们使用" DELETE" sql中的运算符而不读取文件。 请帮助我。

1 个答案:

答案 0 :(得分:1)

您可以使用文件对象对文件执行操作,而无需像 -

那样阅读
f = open("xyz.csv")
for x in f:
    print(x, end=' ')