从 csv (pandas) 读取数据

时间:2021-05-07 23:36:07

标签: python excel pandas csv read-data

我有两张桌子:

<头>
reference_id 排他性
0047465 奢华
0165797 奢华
0013286 选择性
BB010 选择性
<头>
ticket-reference_id product-reference_id
2017010105521000016V 47465
2017010105521000090V 165797
2017010105521000111V 13286
2017010105521000111V BB010

对于这两个表,我都使用了代码:

    pd.read_csv('df1.csv', sep = ';')
    pd.read_csv('df2.csv', sep = ';')

但是在第二个表中的 product_reference_id 列中缺少零。 product_reference_id 和 reference_id 列中的值必须相同。这样我就可以加入两个表。

1 个答案:

答案 0 :(得分:1)

您确定 CSV 本身具有前导 0 吗?您能否粘贴与数据框表中的行相对应的每行的第一行?

假设 CSV 本身都有 0,那么您只需要将这些列作为字符串读取。由于看起来两个 CSV 中的两个列都是字符串 y,因此您可以像这样读取它们:

pd.read_csv('df1.csv', dtype=str, sep=';')

pd.read_csv('df2.csv', dtype=str, sep=';')

如果您想将某些列作为其他数据类型读入,您可以使用 dict for dtype 与各个列和类型。有关信息,请参阅 the pandas docs for read_csv

相关问题