我正在尝试成功提取包含以下文本的CSV文件中的列:
2999,29383,Here is some text,"None",2016-03-18 13:26:42,"Jackson: "Hai"
Jason: "Thx bby bai"
#Living"
我正在尝试提取以杰克逊开头的最后一栏。正如您所看到的,文本包含从Jackson开始的引号,然后应该以#Living结束,它描述了该列的开头和结尾,但问题是该文本在该列中也有引号。这导致csv.reader将这些语句解释为新行。在CSV文件中发生了许多不同的时间,因此我需要帮助解决所有这些潜在问题。
答案 0 :(得分:0)
用于(校正逃逸序列)
2999,29383,Here is some text,"None",2016-03-18 13:26:42,"Jackson: ""Hai""
Jason: ""Thx bby bai""
#Living"
我使用了这段代码
import csv
with open('/tmp/test', 'rb') as csvfile:
spamreader = csv.reader(csvfile, delimiter=',', quotechar='"')
for row in spamreader:
print(row[5])
我的输出是
Jackson: "Hai"
Jason: "Thx bby bai"
#Living