如何分割文件内容以写入另一个文件?

时间:2019-02-15 05:14:28

标签: python regex python-3.x nltk

每次尝试拆分一个文件的内容并将其写入另一个文件时,都会收到类型错误。

该错误表明应使用字符串而不是列表,因此我尝试先进行转换,但仍然收到相同的错误。该文件是一个html页面,其中删除了html标签,因此它只是纯文本

这是收到的错误

...............line 30, in split
w.write(re.split('[^\.\!\?]*[\.\!\?]',str(str1)))
TypeError: write() argument must be str, not list

这是python函数

def split():
x=open("file_a.txt")
w= open("file_b.txt","w+")
str1= x.readlines()
w.write(re.split('[^\.\!\?]*[\.\!\?]',str(str1)))

1 个答案:

答案 0 :(得分:0)

str1 = x.readlines()

这里str1是您所读取文件中的行的列表。相反,您希望在从文件读取的每一行上运行拆分操作。

也通过运行以下行,您尝试将列表写入输出文件。当re.split操作返回一个列表。

w.write(re.split('[^。!\?] * [。!\?]',str(str1)))