我有两个列表reviews_text
(包含所有评论)和review_label
(指示评论是Positive
还是Negative
)。我需要将它们导出到具有reviews_text
和reviews_label
作为两列的csv文件中。
我尝试了以下代码,但无法解决。
np.savetxt('reviews.csv', [p for p in zip(review_text, review_label)], delimiter=',', fmt='%s', encoding="utf-8")
将它们保存为csv文件后,我希望将review_text
放在一个单独的列中,但是它会保存在另一个列中
当我在Excel中打开csv文件时,我得到的是这样的
输出看起来像这样
A , B , C , D , E
1 Very rustic... off Knick... salad potatoes were.. Negative
2 Went here... a crepe... Negative
3 Huge fan of.. hot choc... good place.. Positive
但是我希望输出看起来像这样
A , B
1 Very rustic place. Mismatched furniture,off Knick... Negative
2 Went here for coffee, a crepe and salad but bad p... Negative
3 Huge fan of their meatball, hot chocolate, good p... Positive
我认为每个,
之后的评论都将分开,并转到新的专栏。反正有解决办法吗?谢谢
编辑:
reviews_text
的输出看起来像这样。希望这可以以任何方式帮助解决问题。
输出:
'对于他们所拥有的东西来说太贵了……我有一个叫本德拉迪克的本尼迪克特鸡蛋拼盘,但是它有一个奇怪的配菜汤,还有我个人不喜欢的沙漠。我不认为我会再回到那里。 “非常质朴的地方。家具不匹配,靠近尼克斯的地方。将成为一个很棒的Instagram摄影场所。菜单上有很多种类。我吃过早午餐。里面有鸡蛋,沙拉,土豆,汤和甜点。非常值得。我吃饱了,实际上还没吃完土豆。友善的服务。一定会再来的。” '我强烈推荐Au Festin de Babette的早午餐。他们对早午餐的选择与大多数其他地方不同。我通常会去的东西包括一杯热饮料,一汤,一份焦干酪奶油蛋卷,两个班尼迪克蛋和一个巧克力慕斯。所有的东西都很棒,特别是烤焦干酪奶油蛋卷。这顿饭通常非常令人满意,价格不到20美元,对于蒙特利尔的早午餐来说是合理的。内部非常可爱,感觉很友善,服务通常很好。 ...]
答案 0 :(得分:0)
如果您认为是由于“,”引起的,请将代码中的定界符更改为其他内容。您还可以在评论数据集中对“,”进行编码,并稍后对其进行解码。
答案 1 :(得分:0)
如果需要有效的答案,则应指定所使用数据的一小部分。假设您遇到这种情况:
review_text = ['Very rustic place. Mismatched furniture,off Knick', 'Went here for coffee, a crepe and salad but bad p...', 'Huge fan of their meatball, hot chocolate, good p... ']
review_label = ["Negative", "Negative", "Positive"]
我在您的代码上看到两个问题:一个是对zip对象的令人讨厌的列表理解,另一个是定界符本身。
以下是转换数据的快速解决方案:
import numpy as np
np.savetxt('reviews.csv', np.asarray([review_text, review_label]).T, delimiter='\t', fmt='%s', encoding="utf-8")
值得注意的是,打开文件时,您必须在excel的导入工具中选择仅选项卡。