我是Python的新手,并且过度复杂了项目上的编码,因此我开始使用小得多的数据集来学习过程。我的老板让我比较两个CSV文件。第一个CSV仅在单个列中包含数据1,2,3,4,5,6。他希望我将此CSV文件设置为数组,以便可以将第二个CSV文件与之进行比较。第二个CSV在单个列中包含数据3、5、6。该代码应打印出1,2,4,因为这是两个CSV文件中均未找到的唯一数据。
我最初试图编写代码以导入两个CSV文件并比较数据而不将其设置为数组,但这没有用,因此需要将第一个CSV文件设置为数组。问题是我不确定如何使用数组执行此操作。到目前为止,这就是我所拥有的,任何人能给我的任何帮助将不胜感激。我已经在这个项目上工作了一个星期,即使使用这种简化形式,我仍然全神贯注。
import csv
temp_list = []
with open('1.csv','rb') as csvfile:
reader = csv.reader(csvfile, delimiter=',')
for row in reader:
答案 0 :(得分:0)
就伪代码而言,您需要在此处将两个csv文件导入到两个单独的数组中,例如,数组A和数组B。
现在,您需要做的是将一个数组中的每个索引位置与另一个数组中的每个索引位置进行比较。 您需要创建一个嵌套循环,其中外部循环将在A中选择一个索引位置,然后内部循环将在B中选择一个位置。
在检查A中的一个索引与B中的每个位置之后,并且没有相同的位置,我建议将此值添加到第三个数组C中。您可以使用布尔值标志检查哪些位置相同。完成代码后,C将具有A和B都不存在的任何值。
我建议按照以下教程学习有关python语法的更多信息: https://www.w3schools.com/python/
祝你好运