我想收集由谷歌搜索的日文文章。
我尝试提取日语句子。 为了防止句子在csv文件中分成几行,我们决定删除代表该行末尾的所有换行 然后运行以下代码提取句子。
text = text.replace('\n', '').replace('\t', '').replace(' ', '').replace(u'\n', '').replace(u'\t', '').replace(u' ', '')
text = text.encode('utf-8')
with open('out.csv', 'a') as f:
writer = csv.writer(f, delimiter= ',' ,lineterminator='\n')
writer.writerow([text, response.url])
但是,当我查看输出的csv时,这些句子仍然分为几行。 如何防止句子被分割? 另外,我想删除换行符以防止句子被分割,但是我不想删除句子中的换行符。 考虑到这一点,我想告诉您如何将句子分成几行