我有两个大文件(8gb文本文件和16GB csv文件),我想从每个文件中提取随机的10000行并保存在新文件中。即来自一个文件中的文本文件的随机样本和来自另一个文件中的csv的随机样本。我试过了Random Sample
但问题是它无法正确地将数据保存到新文件中它会产生奇怪的输出(16列中只有3列结果)
f= raw_input("Enter the fp of the csv file: ")
n = sum(1 for line in open(f)) - 1 #number of records in file (excludes header)
n1=raw_input ("Enter Number of rows required in sample file")
with open(f) as mf:
head = list(islice(mf, n1))
with open('1.csv' , 'w') as out:
out.write(str(head))
any help
非常感谢