从GML文件中提取数据

时间:2013-02-08 18:47:44

标签: python python-3.x networkx graph-modelling-language

我有一个GML(图形(不是涂鸦)建模语言)文件,我想从中创建ID到标签的映射。我不知道如何做到这一点,因为我的列表操作似乎不起作用。我尝试使用指定如何使用两个分隔符的示例,但它不适用于我的文件。

有人可以指导我吗?

GML文件的排列如下:

graph [
  node [
    id 0
    label "24"
  ]
  node [
    id 1
    label "25"
  ]
  node [
    id 2
    label "26"
  ]
  node [
    id 3
    label "27"
  ]
  node [
    id 4
    label "20"
  ]
  node [
    id 5
    label "21"
  ]
(... some more nodes)
  edge [
    source 0
    target 75
    weight 4
  ]
  edge [
    source 0
    target 68
    weight 2
  ]
(many more edges)
]

我想提取每个节点块中的数据,并创建节点ID到节点标签的映射。例如,第一个节点的映射将是0-> 24,依此类推。我并不担心边缘信息。

提前感谢您的帮助。

1 个答案:

答案 0 :(得分:7)

如果您可以使用NetworkX(Python),您可以像这样读取文件(t.gml是您的文件)并获取映射

In [1]: import networkx as nx

In [2]: G = nx.read_gml('t.gml')

In [3]: G.node
Out[3]: 
{0: {'id': 0, 'label': u'24'},
 1: {'id': 1, 'label': u'25'},
 2: {'id': 2, 'label': u'26'},
 3: {'id': 3, 'label': u'27'},
 4: {'id': 4, 'label': u'20'},
 5: {'id': 5, 'label': u'21'}}

e.g。

In [4]: G.node[0]['label']
Out[4]: u'24'