将ASCII文件解析为MySQL表

时间:2013-12-10 23:17:03

标签: php mysql parsing

对于一个项目,我需要在数据库中获得一些单词定义。所有的定义都可以在多个DB文件中找到,但我得到的数据库文件是用于C语言程序的,并且采用ASCII格式(我相信)。我需要以某种方式对文件进行彻底翻译,逐行将数据添加到MySQL数据库中。

我更喜欢使用PHP和/或MySQL。

我尝试编写一个PHP脚本来完成并执行它,但它超时并且在我的系统上是密集的,并且在大多数情况下都没有完成。

我从MySQL那里听说过LOAD DATA INFILE,但不知道如何使用它。

每个文件的文件名都有变化,没有特定的扩展名,但是,所有文件都可以从文本文件中读取,我相信它们在内容方面都是一样的。

我上传了一个文件here的内容。

你可以看到一些行是无用的,但是以{开头的行是好的,模式本质上是第一个单词是字典术语,()中的内容是定义。 ""中的部分是样本句子。

我需要提取的是术语,定义和句子。

这些定义由普林斯顿大学提供,许可证是开源的(我会将其归功于他们)。

1 个答案:

答案 0 :(得分:1)

除非你想重新发明轮子,否则我会选择类似wordnet2sql的东西。它将输出一个可用于创建MySQL表的SQL脚本。

您可以在princeton's website上找到数据库规范。

LOAD DATA对于csv文件非常有用,但对于特殊数据库格式则没有那么多。