我的数据库结构非常简单:
+-------+---------------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-------+---------------------+------+-----+---------+----------------+
| id | int(11) unsigned | NO | PRI | NULL | auto_increment |
| ngram | varchar(64) | NO | UNI | | |
| count | bigint(20) unsigned | NO | MUL | NULL | |
+-------+---------------------+------+-----+---------+----------------+
您可能会猜到我将Google Web Ngrams内容导入此数据库。
该文件是制表符分隔的CSV文件,首先是ngram,然后是计数秒。
这是我认为可行的命令:
LOAD DATA INFILE 'vocab' INTO TABLE ngrams_copy FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' (ngram, count)
但是我收到一个错误说:
Row 9558923 doesn't contain data for all columns
但我认为,因为我指的是ngram和count列,我告诉它这没关系。
我会喜欢任何帮助,因为我已经超出了我的专业领域。