我正在尝试将多个段落中的评论连接成一个 - 我正在尝试这样:
for x in docs:
with open(fp) as data_file:
data_item = json.load(data_file)
b = data_item['reviews']
for item in b:
name = '000' + str(counter) + '.txt'
file = open(name, 'wb')
output = item['text']
" ".join(output.split())
counter = counter+1
file.write(output.encode('utf-8'))
file.close()
然而,它不起作用;每个.txt输出文件在JSON字段中都是(使用\ n \ n)...
示例JSON:
{"评论":[ { "创建":" 2008-07-09T00:00:00", "文字":"有令人放心的东西等等\ n \ n乐队的技巧 等等\ n \ nCraig Finn的主唱等\ n", }, " votes_negative":0, " votes_positive":0 }]}
结果输出(.txt):
有一些令人放心的东西等。
乐队的技巧等。
Craig Finn的主唱等。
非常感谢提前。
答案 0 :(得分:1)
如果我正确地阅读了您的问题,您希望所有内容都在一行上,您可以这样做:
...
output = item['text'].replace('\n',' ')
...
输出:
There's something reassuring etc. The band's skill etc. Craig Finn's vocals etc.
或者如果你想在每个之间插入一行:
...
output = item['text'].replace('\n\n','\n')
...
输出:
There's something reassuring etc.
The band's skill etc.
Craig Finn's vocals etc.
# One extra blank line here