我目前正致力于在CSV文件和mySQL数据库之间格式化数据。我使用MySQLdb库来管理连接,但似乎是格式化的一些问题。我不得不承认,我在mySQL或Python方面都不是很有经验,但是从实用的角度来看,大多数人一直都很努力。
#!/usr/bin/python
# -*- coding: utf-8 -*-
import MySQLdb
QUERY = "SELECT * FROM searches WHERE searchdate BETWEEN '2011-08-08' AND '2011-08-14';"
conn = MySQLdb.connect (unix_socket = '/opt/local/var/run/mysql5/mysqld.sock',host = "localhost", user = "username", passwd= "passwd", db="db")
c = conn.cursor()
c.execute(QUERY)
for row in c.fetchall():
print row
这是从数据库中提取记录的脚本。在此过程的后期,我想从每一行中提取数据并将其格式化为CSV,但目前我的问题是打印到屏幕的数据如下所示:
('\xc3\xa6nima', ' 1', ' 12782027', ' 35', datetime.date(2011, 8, 13))
('\xc3\xa6nima', ' 1', ' 12823616', ' 59', datetime.date(2011, 8, 10))
('\xc3\xa6oc', ' 1', ' 13078573', ' 55', datetime.date(2011, 8, 14))
('\xc3\xa6re', ' 1', ' 12516300', ' 35', datetime.date(2011, 8, 8))
('\xc3\xa6re v\xc3\xa6re deg', ' 1', ' 13145801', ' 59', datetime.date(2011, 8, 13))
('\xc3\xa6re v\xc3\xa6re deg og lammet', ' 1', ' 13145801', ' 59', datetime.date(2011, 8, 13))
('\xc3\xa6re v\xc3\xa6re jesu navn', ' 1', ' 13136667', ' 59', datetime.date(2011, 8, 11))
('\xc3\xa6rlig vuggevise', ' 1', ' 12386933', ' 35', datetime.date(2011, 8, 12))
('\xc3\xa6ror aleina', ' 1', ' 12867037', ' 35', datetime.date(2011, 8, 12))
('\xc3\xa6sj', ' 1', ' 13130891', ' 59', datetime.date(2011, 8, 8))
('\xc3\xa6thenor', ' 1', ' 12555673', ' 35', datetime.date(2011, 8, 10))
我现在遇到的问题是我应该如何以兼容格式获取数据。所以我想我想知道如何访问和更改数据库中的字符集为UTF-8,以及是否需要重建所有数据或是否有自动方法来处理此问题。如果有人能指出我如何使用内置函数格式化datatime.date,我也会非常高兴(我知道我可以使用正则表达式和重建,但可能有一个更优雅的解决方案)。
提前感谢您的帮助!
答案 0 :(得分:1)
在第一列中,某些字符不可打印,因此会转换为十六进制字符。 datetime对象中的最后一列。 Python提供strftime函数将其转换为字符串。
for row in c.fetchall():
print row[0], row[1], row[2], row[3], row[4].strftime('%Y-%m-%d')
会奏效。
此外,您可以使用
写入文件file.write(",".join((row[0], row[1], row[2], row[3], row[4].strftime('%Y-%m-%d'))))
其中,file是文件对象。它将写为逗号分隔列。您可以在此处打开文件中的原始字符。
答案 1 :(得分:1)
我不熟悉MySQLdb 但它应该是这样的
conn = MySQLdb.connect(unix_socket ='/ opt / local / var / run / mysql5 / mysqld.sock',host =“localhost”,user =“username”,passwd =“passwd”,db =“db ”的 字符集= “UTF-8” 强>)
确保您的数据库也可以使用utf-8
使用pypdbc这看起来像
import pyodbc
con = pyodbc.connect('DRIVER={MySQL ODBC 3.51 Driver};SERVER=localhost;DATABASE=db;UID=user;PWD=blabla',charset='utf8', init_command='SET NAMES UTF8')
cursor = con.cursor()
str=u'''INSERT INTO migdal_hist VALUES("","2011/03/01","0","בלהבלה","0",","0","0")'''
cursor.execute(str.encode('utf-8'))
con.commit()
答案 2 :(得分:0)
也许你需要这样的事情:
mysql = MySQLdb.connect(host = '...', [...] use_unicode = True)
cursor = mysql.cursor()
cursor.execute("SET NAMES 'utf8'")
让我们试试吧:)。