将数据集存储在mysql数据库中 - 6000个条目

时间:2018-05-11 21:18:41

标签: mysql

我有一组我从public page收集的数据。请注意,超过6000个条目。 有些数据集比其他数据集更完整。换句话说,有些人拥有更多的数据。

目标是什么:我想将数据集存储在mysql数据库中...如何获得可行方法的第一步。

  'title' => 'ZWIAZEK MLODZIEZY MNIEJSZOSCI NIEMIECKIEJ',
            'hand' => [
                        'Receiving',
                        'Sending',
                        'Coordinating'
                      ],
            'external_url' => 'http://www.bjdm.eu',
            'topics' => [
                          'Youth (Participation, Youth Work, Youth Policy)',
                          'Creativity and culture',
                          'Romas and/or other minorities'
                        ],
            'pic_number' => '939424146',
            'internal_url' => 'https://europa.eu/youth/volunteering/organisation/939424146_en',
            'location' => 'Opole, Poland'
          },
          {
            'location' => 'Czestochowa, Poland',
            'internal_url' => 'https://europa.eu/youth/volunteering/organisation/947395412_en',
            'hand' => [
                        'Receiving',
                        'Sending',
                        'Coordinating'
                      ],
            'title' => 'Zwiazek Mlodziezy Wiejskiej Czestochowa',
            'topics' => [
                          'Access for disadvantaged',
                          'Creativity and culture',
                          'Early School Leaving / combating failure in education'
                        ],
            'pic_number' => '947395412',
            'external_url' => 'http://www.zmwczestochowa.pl'
          },
          {
            'title' => "ZWIAZEK POLSKICH KAWALER\x{d3}W MALTANSKICH SUWERENNEGO RYCERSKIEGO ZAKONU SZPITALNIK\x{d3}W SWIETEGO JANA JEROZOLIMSKIEGO ZWANEGO RODYJSKIM I MALTANSKIM",
            'hand' => [
                        'Receiving'
                      ],
            'external_url' => 'http://www.centrummaltanskie.eu',
            'topics' => [
                          'Inclusion - equity',
                          'Disabilities - special needs',
                          'Social dialogue'
                        ],
            'pic_number' => '941314385',
            'internal_url' => 'https://europa.eu/youth/volunteering/organisation/941314385_en',
            'location' => "Krak\x{f3}w, Poland"
          },

请注意,超过6000个条目.....; 一些数据集比其他数据集更完整:换句话说,一些数据集有更多的数据行。目标是什么:我想将数据集存储在mysql数据库中。

如何迈出可行方法的第一步。

从此处可以看到的页面显示的数据http://europa.eu/youth/volunteering/evs-organisation#open 我们需要一些数据库表。 (检查其余数据可能会发现更多):

我在上面提到的页面显示了欧洲的一系列开源项目:

我们可以......:

  • 找到可能涉及需要一些额外支持的志愿者的组织:
  • 具有额外辅导或其他支持的组织,适合有障碍,教育困难,文化差异或类似情况的志愿者。
  • 具有适合身体,感官或其他残疾(如轮椅通道等)志愿者的物理环境的组织。
  • 寻找志愿者的组织,他们面临使参与活动更加困难的情况。

回到数据库:主表是Organization,hand_type和topic。 因为每个组织都有多个手和主题,所以中间表是必需的。

+------------------+                                              +------------------+
| organization     |                                              |  hand_type       |
+------------------+                                              +------------------+
| org_id (PK)      |---+-+       +-------------------+     +------| hand_type_id(PK) |
| title            |   | |       |   org_hand        |     |      | description      |
| location         |   | |       +-------------------+     |      +------------------+
| pic_number       |   | |       | org_hand_id (PK)  |     |
| internal_url     |   | +------<| org_id      (FK)  |     |
| external_url     |   |         | hand_type_id(FK)  |>----+
+------------------+   |         +-------------------+
                       |                                          +------------------+
                       |                                          |  topic           |
                       |         +-------------------+            +------------------+
                       |         |  org_topic        |     +------| topic_id (PK)    |
                       |         +-------------------+     |      | description      |
                       |         | org_topic_id (PK) |     |      +------------------+
                       +--------<| org_id       (FK) |     |
                                 | topic_id     (FK) |>----+ 
                                 +-------------------+

再次见http://europa.eu/youth/volunteering/evs-organisation#open

我想我们可以稍微缩小这个概念...

0 个答案:

没有答案