Question

我正在尝试成功提取包含以下文本的CSV文件中的列：

2999,29383,Here is some text,"None",2016-03-18 13:26:42,"Jackson: "Hai"

Jason: "Thx bby bai"

#Living"

我正在尝试提取以杰克逊开头的最后一栏。正如您所看到的，文本包含从Jackson开始的引号，然后应该以#Living结束，它描述了该列的开头和结尾，但问题是该文本在该列中也有引号。这导致csv.reader将这些语句解释为新行。在CSV文件中发生了许多不同的时间，因此我需要帮助解决所有这些潜在问题。

Answer 1

用于（校正逃逸序列）

2999,29383,Here is some text,"None",2016-03-18 13:26:42,"Jackson: ""Hai""

Jason: ""Thx bby bai""

#Living"

我使用了这段代码

import csv
with open('/tmp/test', 'rb') as csvfile:
    spamreader = csv.reader(csvfile, delimiter=',', quotechar='"')
    for row in spamreader:
        print(row[5])

我的输出是

Jackson: "Hai"

Jason: "Thx bby bai"

#Living

使用额外的引号在CSV文件中提取文本

1 个答案: