Question

我有两个列表reviews_text（包含所有评论）和review_label（指示评论是Positive还是Negative）。我需要将它们导出到具有reviews_text和reviews_label作为两列的csv文件中。

我尝试了以下代码，但无法解决。

np.savetxt('reviews.csv', [p for p in zip(review_text, review_label)], delimiter=',', fmt='%s', encoding="utf-8")

将它们保存为csv文件后，我希望将review_text放在一个单独的列中，但是它会保存在另一个列中

当我在Excel中打开csv文件时，我得到的是这样的

输出看起来像这样

         A       ,       B       ,       C       ,       D       ,       E

1 Very rustic...   off Knick...    salad           potatoes were..  Negative

2 Went here...     a crepe...      Negative

3 Huge fan of..    hot choc...     good place..    Positive

但是我希望输出看起来像这样

                   A                                     ,     B      

1 Very rustic place. Mismatched furniture,off Knick...      Negative

2 Went here for coffee, a crepe and salad but bad p...      Negative

3 Huge fan of their meatball, hot chocolate, good p...      Positive

我认为每个,之后的评论都将分开，并转到新的专栏。反正有解决办法吗？谢谢

编辑：

reviews_text的输出看起来像这样。希望这可以以任何方式帮助解决问题。

输出：

'对于他们所拥有的东西来说太贵了……我有一个叫本德拉迪克的本尼迪克特鸡蛋拼盘，但是它有一个奇怪的配菜汤，还有我个人不喜欢的沙漠。我不认为我会再回到那里。 “非常质朴的地方。家具不匹配，靠近尼克斯的地方。将成为一个很棒的Instagram摄影场所。菜单上有很多种类。我吃过早午餐。里面有鸡蛋，沙拉，土豆，汤和甜点。非常值得。我吃饱了，实际上还没吃完土豆。友善的服务。一定会再来的。” '我强烈推荐Au Festin de Babette的早午餐。他们对早午餐的选择与大多数其他地方不同。我通常会去的东西包括一杯热饮料，一汤，一份焦干酪奶油蛋卷，两个班尼迪克蛋和一个巧克力慕斯。所有的东西都很棒，特别是烤焦干酪奶油蛋卷。这顿饭通常非常令人满意，价格不到20美元，对于蒙特利尔的早午餐来说是合理的。内部非常可爱，感觉很友善，服务通常很好。 ...]

Answer 1

如果您认为是由于“，”引起的，请将代码中的定界符更改为其他内容。您还可以在评论数据集中对“，”进行编码，并稍后对其进行解码。

Answer 2

如果需要有效的答案，则应指定所使用数据的一小部分。假设您遇到这种情况：

review_text = ['Very rustic place. Mismatched furniture,off Knick', 'Went here for coffee, a crepe and salad but bad p...', 'Huge fan of their meatball, hot chocolate, good p... ']  
review_label = ["Negative", "Negative", "Positive"]

我在您的代码上看到两个问题：一个是对zip对象的令人讨厌的列表理解，另一个是定界符本身。

以下是转换数据的快速解决方案：

import numpy as np  
np.savetxt('reviews.csv', np.asarray([review_text, review_label]).T, delimiter='\t', fmt='%s', encoding="utf-8")

值得注意的是，打开文件时，您必须在excel的导入工具中选择仅选项卡。

如何将两个字符串列表导出到csv文件的两列中而不会分开

2 个答案: