我正在尝试使用python 3.7将大型CSV文件的一列导入MySQL。这是作为导入其余列的测试运行而完成的。
就目前而言,我什至无法将一栏输入数据库。我希望能找到一些帮助。
我已经建立了一个数据库,其中只有一个表,只有一个字段用于测试数据:
mysql> use aws_bill
Database changed
mysql> show tables;
+--------------------+
| Tables_in_aws_bill |
+--------------------+
| billing_info |
+--------------------+
mysql> desc billing_info;
+----------+---------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+----------+---------+------+-----+---------+-------+
| RecordId | int(11) | NO | | NULL | |
+----------+---------+------+-----+---------+-------+
运行代码时:
mydb = mysql.connector.connect(user='xxxx', password='xxxxx',
host='xxxxx',
database='aws_bill')
cursor = mydb.cursor()
try:
with open(source) as csv_file:
csv_reader = csv.reader(csv_file, delimiter=',')
sql = "INSERT INTO billing_info (RecordId) VALUES (%s)"
for row in csv_reader:
row = (', '.join(row))
print(row)
cursor.execute(sql, row)
except:
mydb.rollback()
finally:
mydb.close()
仅打印CSV列的一行:
python3 .\aws_billing.py
200176595756546201775238333
没有任何东西进入数据库:
mysql> select RecordId from billing_info;
Empty set (0.00 sec)
如果我注释掉sql插入语句:cursor.execute(sql, row)
然后打印出CSV的所有行:
203528424494971448426778962
203529863341009197771806423
203529974021473640029260511
203530250722634745672445063
203525214761502622966710100
203525122527782254417348410
203529365278919207614044035
...continues to the end of the file
但是,当然没有任何数据进入数据库。因为SQL行已被注释掉。至少现在已经打印了CSV的所有行,但是,将它们放入数据库中会很好!
为什么会这样?如何将CSV的所有行都放入数据库中?
答案 0 :(得分:1)
您可以这样做:
更改此行
sql = "INSERT INTO billing_info (InvoiceId) VALUES (%s)"
sql = "INSERT INTO billing_info (InvoiceId) VALUES {}"
这个:
cursor.execute(sql, row)
至
cursor.execute(sql.format(row))