我们可以在不读取文件的情况下对csv文件或sql表进行操作,即不使用read_csv或read_sql_table。
基本上我有一个非常大的文件,需要比较两个文件或表并删除公共行。
import pandas as pd
colnames=['email']
data= pd.read_csv("sample",names=colnames, header=None)
data1=pd.read_csv("sample1",names=colnames,header=None)
filter=data[~data['email'].isin(data1)]
我一直这样做,但是当我读csv文件时,它需要花费很多时间。 那么有没有其他方法来执行此操作,就像我们使用" DELETE" sql中的运算符而不读取文件。 请帮助我。
答案 0 :(得分:1)
您可以使用文件对象对文件执行操作,而无需像 -
那样阅读f = open("xyz.csv")
for x in f:
print(x, end=' ')