我正在尝试将维基百科访问日志(http://dumps.wikimedia.org/other/pagecounts-raw/)导入mysql以供内部使用 目标:绘制日期/网址图
维基百科文件名包含日期和小时,并具有以下结构:
语言网址访问size_of_answer
我目前的数据库结构:
Table urls: url_id;url_string;language Indexes on everything Table visits: visits_id;url_id;day_stamp;visits_count Indexes on everything Table temp: visits_id;url_id;url_string;language;visits_count;day_stamp
MySQL引擎:InnoDB
目前的方法:
导入所有这些最多需要5分钟。
这是更快的方法吗?另一个步骤,另一个DB?