Question

需要将具有100,000多条记录的单个文件中的数据加载到MySQL上的多个表中，以维护文件/表中定义的关系;意味着关系已经匹配。该解决方案应该适用于最新版本的MySQL，并且需要使用InnoDB引擎; MyISAM不支持外键。

我是使用Pentaho数据集成（又名Kettle）的全新手段，任何指针都会受到赞赏。

我可能会补充说，要求不禁用外键约束。由于我的理解是，如果数据库的引用完整性存在问题，MySQL将不会在重新打开外键约束时检查引用完整性。 消息来源： 5.1.4。服务器系统变量 - foreign_key_checks

如果插入失败，或者无法保持参照完整性，则所有方法都应包括验证和回滚策略中的一些。

同样，对此全新，并尽力提供尽可能多的信息，如果您有任何疑问或要求澄清 - 请告诉我。

如果您能够从超级的kjb和ktr文件（作业/转换）发布XML。甚至可能追捕你在任何地方所做的每一条评论/答案，然后投票给他们...... :-) ......真的，找到答案对我来说真的很重要。

谢谢！

示例数据：为了更好地举例说明，我们假设我正在尝试加载包含员工姓名的文件，他们过去占用的办公室以及由标签分隔的职位名称历史记录

文件：

EmployeeName<tab>OfficeHistory<tab>JobLevelHistory
John Smith<tab>501<tab>Engineer
John Smith<tab>601<tab>Senior Engineer
John Smith<tab>701<tab>Manager
Alex Button<tab>601<tab>Senior Assistant
Alex Button<tab>454<tab>Manager

注意：单个表数据库是完全规范化的（与单个表一样多） - 例如，在“John Smith”的情况下，只有一个John Smith;意思是没有重复会导致参照完整性的冲突。

MyOffice数据库架构包含以下表格：

Employee (nId, name)
Office (nId, number)
JobTitle (nId, titleName)
Employee2Office (nEmpID, nOfficeId)
Employee2JobTitle (nEmpId, nJobTitleID)

所以在这种情况下。表格应如下所示：

Employee
1 John Smith
2 Alex Button

Office
1 501
2 601
3 701
4 454

JobTitle
1 Engineer
2 Senior Engineer
3 Manager
4 Senior Assistant

Employee2Office
1 1
1 2
1 3
2 2
2 4

Employee2JobTitle
1 1
1 2
1 3
2 4
2 3

这是创建数据库和表格的MySQL DDL：

create database MyOffice2;

use MyOffice2;

CREATE TABLE Employee (
      id MEDIUMINT NOT NULL AUTO_INCREMENT,
      name CHAR(50) NOT NULL,
      PRIMARY KEY (id)
    ) ENGINE=InnoDB;

CREATE TABLE Office (
  id MEDIUMINT NOT NULL AUTO_INCREMENT,
  office_number INT NOT NULL,
  PRIMARY KEY (id)
) ENGINE=InnoDB;

CREATE TABLE JobTitle (
  id MEDIUMINT NOT NULL AUTO_INCREMENT,
  title CHAR(30) NOT NULL,
  PRIMARY KEY (id)
) ENGINE=InnoDB;

CREATE TABLE Employee2JobTitle (
  employee_id MEDIUMINT NOT NULL,
  job_title_id MEDIUMINT NOT NULL,
  FOREIGN KEY (employee_id) REFERENCES Employee(id),
  FOREIGN KEY (job_title_id) REFERENCES JobTitle(id),
  PRIMARY KEY (employee_id, job_title_id)
) ENGINE=InnoDB;

CREATE TABLE Employee2Office (
  employee_id MEDIUMINT NOT NULL,
  office_id MEDIUMINT NOT NULL,
  FOREIGN KEY (employee_id) REFERENCES Employee(id),
  FOREIGN KEY (office_id) REFERENCES Office(id),
  PRIMARY KEY (employee_id, office_id)
) ENGINE=InnoDB;