使用Python将大型CSV文件导入MySQL

时间:2019-04-28 17:32:13

标签: python mysql csv

我正在尝试使用python 3.7将大型CSV文件的一列导入MySQL。这是作为导入其余列的测试运行而完成的。

就目前而言,我什至无法将一栏输入数据库。我希望能找到一些帮助。

我已经建立了一个数据库,其中只有一个表,只有一个字段用于测试数据:

mysql> use aws_bill
Database changed

mysql> show tables;
+--------------------+
| Tables_in_aws_bill |
+--------------------+
| billing_info       |
+--------------------+

mysql> desc billing_info;
+----------+---------+------+-----+---------+-------+
| Field    | Type    | Null | Key | Default | Extra |
+----------+---------+------+-----+---------+-------+
| RecordId | int(11) | NO   |     | NULL    |       |
+----------+---------+------+-----+---------+-------+

运行代码时:

mydb = mysql.connector.connect(user='xxxx', password='xxxxx',
                            host='xxxxx',
                            database='aws_bill')
cursor = mydb.cursor()
try:
    with open(source) as csv_file:
        csv_reader = csv.reader(csv_file, delimiter=',')
        sql = "INSERT INTO billing_info (RecordId) VALUES (%s)"
        for row in csv_reader:
            row = (', '.join(row))
            print(row)
            cursor.execute(sql, row)
except:
    mydb.rollback()
finally:
    mydb.close()

仅打印CSV列的一行:

python3 .\aws_billing.py
200176595756546201775238333

没有任何东西进入数据库:

mysql> select RecordId from billing_info;
Empty set (0.00 sec)

如果我注释掉sql插入语句:cursor.execute(sql, row)

然后打印出CSV的所有行:

203528424494971448426778962
203529863341009197771806423
203529974021473640029260511
203530250722634745672445063
203525214761502622966710100
203525122527782254417348410
203529365278919207614044035
...continues to the end of the file

但是,当然没有任何数据进入数据库。因为SQL行已被注释掉。至少现在已经打印了CSV的所有行,但是,将它们放入数据库中会很好!

为什么会这样?如何将CSV的所有行都放入数据库中?

1 个答案:

答案 0 :(得分:1)

您可以这样做:

更改此行 sql = "INSERT INTO billing_info (InvoiceId) VALUES (%s)"

sql = "INSERT INTO billing_info (InvoiceId) VALUES {}"

这个: cursor.execute(sql, row)cursor.execute(sql.format(row))