我终于使用Python 2.7 minGW和pymsql在Windows 7上运行了imbdpy2sql,并且它连接到数据库并且创建了所有表但是它一直卡在Flushind MoviesCache上并且从未移动过它。这是它的输出:
SAVING ImdbID values for ... DONE
DROPPING current database ... DONE
CREATING New tables ... DONE
SCANNING movies
并列出10001然后再列出20001,依此类推至90001然后它显示* FLUSHING MoviesCache
但它永远不会超越它。我应该多久让它坐在那里?如果不是两个小时,我已经离开它至少一个小时没有进展。有什么办法可以让它运作起来吗?或者它是否有效,我只需要让它坐几个小时?
如果这有助于我通过打开命令提示符运行它,转到C:\Python27\Scripts\bin\
然后使用此命令:
imdbpy2sql.py -d C:\USers\Jordan\DEsktop\IMDB -u mysql://root:lookool@localhost/IMDB
答案 0 :(得分:1)
不,这不正常:冲洗最多需要几十秒。
我会尝试重现它;同时,你可以尝试使用CSV导入系统:使用相同的选项再次运行imdbpy2sql.py,添加“-c C:\ Temp”(没有引号 - 或类似的东西:也许它需要两个反斜杠,对于目录分隔符,在Windows系统上。)
如果您有权访问linux / unix环境,您还可以使用docs / goodies /目录中的reduce.sh脚本对部分数据集进行一些实验。
答案 1 :(得分:0)
[MySQL的]
一般来说,如果你得到一个令人尴尬的高数量的“太多的数据 ... SPLITTING“行,考虑增加max_allowed_packet(在 您的MySQL服务器配置)至少8M或16M。 否则,插入数据会非常慢,有些数据可能会 迷路了。
它写在他们的文件中:))