在python中写入文件有硬性还是上限?我有一个包含大约800万条记录的CSV,我的脚本将行随机化然后输出。完成后,随机文件只有大约500万条记录。知道会发生什么,或者实际上是否存在我应该注意的限制? 提前谢谢。
编辑:这是我用来编写文件的代码。
def createOutputFile(fileIn, header, fileCap, extension):
outfileName = 'Randomized_Data.'+extension
if(header == 'Y' or header == 'y'):
infile = open(fileIn,'r')
headerline = infile.readline()
lines = open(fileIn).readlines() # read whole file
random.shuffle(lines) # randomize
lines = lines[:fileCap] # write up to the use specified length
with open(outfileName,'a+') as outfile:
if(not headerline==""):
outfile.write(headerline)
outfile.writelines(lines)
编辑2:关于fileCap
变量的问题,这将是文件的最大长度。
if (fc == ""):
# gets size of file (in rows)
file = open(fn)
fc = len(file.readlines())
else:
fc = int(fc)
其中fc
作为fileCap
传递
答案 0 :(得分:0)
我的Python代码中没有东西,实际上似乎是文件中的一个坏字符。