我有一个大约450 mb的大文本文件。我读过了,出来的是字符串。
import pandas as pd
import numpy as np
import re
def readInChunks(fileObj, chunkSize=2048):
while True:
data = fileObj.read(chunkSize)
if not data:
break
yield data
result=[]
f = open("textfile.txt")
for chunk in readInChunks(f):
result.append(chunk)
f.close()
我得到的结果是一个很大的字符串文件,可以说结果。 结果[0]在下面给出
Alin Deutsch, Mary F. Fernandez, 1998
Alin Deutsch, Daniela Florescu, 1998
Alin Deutsch, Alon Y. Levy, 1998
现在我希望将此字符串按照以下方式转换为数据框
c1 c2 c3
r1 Alin Deutsch Mary F. Fernandez 1998
r2 Alin Deutsch Daniela Florescu 1998