我想逐行读取一个csv文件,在每次迭代中,我需要比较该行第一列中出现的单词与下一行中相同位置出现的单词。 然后,我将分别复制值。
当我将csv文件中的行复制到数组中时,所有值都在同一单元格中,因此我无法使用它。
我想和熊猫一起工作,所以我需要按索引选择列-我该怎么做?
我正在为此寻求解决方案,谢谢:)
答案 0 :(得分:0)
您的问题不是很清楚,我希望我以正确的方式回答。尝试将csv转换为名为df的熊猫数据框,然后调用df.values
答案 1 :(得分:0)
如果您已经读出了这些行(在注释中写到另一个答案)-这些是字符串-您可以将它们分成variable_containing_line.split(',')
到列表中-用任何字符替换','如果分割字符不是逗号,则是合适的。
split()
方法将返回零件列表。
看来,您应该然后遍历这些行的所有第一对元素。也许带有枚举,也许带有zip更优雅:
for i, j in zip(first_elements[1:], first_elements[:-1]):
if i==j:
do_something()