对于小型实验,我想将导出的OSM数据集从XML转换为Prolog。
我知道有一些通用的XML到Prolog转换器(例如,Pl4Xml),但这些通用转换器是解决此问题的最佳方法吗?可能有人知道一个库将OSM数据转换为Prolog中的方便表示?
答案 0 :(得分:2)
tt2(tag, Attrs, _) :-
memberchk(k=Key, Attrs),
\+ tag(Key), assertz(tag(Key)),
fail ; true.
?- dynamic tag/1.
?- new_sgml_parser(Parser, []),
open('UA.osm', read, Stream),
sgml_parse(Parser, [source(Stream), call(begin, tt2)]),
free_sgml_parser(Parser),
close(Stream).
UA.osm是我的XML数据。我有1000多个不同的标签键。它应该妥善处理。我认为最好的方法是使用OSM节点的谓词,方式和与公共tags
成员的关系,并将标签数据表示为一组有序的键值对(或AVL树)。因为我是Uranium Test的开发人员,所以我认为Uranium为Prolog提供了最好的对象模型(没有锁定特定的Prolog实现)。我可以举例说明如何管理OSM对象关系:
:- module(node_v, [on_begin/3, on_end/2]).
:- use_module(u(v)).
% helper for callback tag parsing
new_class(xml_tag_v, db_object_v, [closed_by_parser]).
% OSM element
new_class(element_v, xml_tag_v,
[id,
changeset,
visible,
user,
timestamp,
tags]).
% OSM node, way and barrier - children of element
new_class(node_v, element_v, [lat, lon]).
new_class(way_v, element_v, [nodes]).
new_class(barrier_v, element_v, [barrier_type]).
% Example of a tag-based dynamic class
% (see http://wiki.openstreetmap.org/wiki/Barriers)
'element_v?'(Obj, class, barrier_v) :-
obj_field(Obj, tags, Tags),
% if it contains Key:barrier it is a barrier
% (way or node)
memberchk(barrier-_, Tags), !.
% XML parsing callbacks
on_begin(node, Attrs, _) :-
% Construct the node_v object
obj_construct(node_v, [], [], Obj),
foreach(member(Name=Value, Attrs),
obj_field(Obj, weak, Name, Value)),
% Put it into DB 'nodes'
db_recorda(nodes, Obj).
on_begin(tag, Attrs, _) :-
db_recorded(nodes, Obj0), !,
obj_rewrite(Obj0,
[closed_by_parser, tags],
[Is_Closed, Tags0],
[Is_Closed, Tags], Obj),
var(Is_Closed), !, % found unclosed node
memberchk(k=Key, Attrs),
memberchk(v=Value, Attrs),
( var(Tags0) -> Tags1 = [] ; Tags1 = Tags0 ),
Tags = [Key - Value|Tags1], % add new tag
db_recorda(nodes, _, Obj, _, replaced). % db update
on_end(node, _) :-
% close the node parsing
db_recorded(nodes, Obj0), !,
obj_rewrite(Obj0,
[closed_by_parser, tags],
[_, Tags0],
[true, Tags], Obj),
( var(Tags0)
-> Tags = []
; sort(Tags0, Tags) % if your expectation for a number of tags is big
% try use library(assoc) (AVL trees)
),
db_put_object(nodes, _, Obj, _, replaced).
new_class / 3定义了一个类 - 它是一个通常的prolog术语,可以对值进行命名访问(借助其他谓词)以及许多其他内容,如继承,对象数据库等。该模块定义了三个主要的OSM实体 - node_v
,way_v
和relation_v
(_v是对象的后缀)作为element_v
的子项。每个element_v
都包含tags
字段。
barrier_v
是一个如何基于标记键(或值)识别OSM类的示例。在此示例中,特殊谓词'element_v?'/ 3计算对象的类。 barrier_v可以是node_v或way_v的子节点(本例中未显示)。
该模块的最后一部分是XML(回调)解析器。我用~1.7G文件测试它,它运行良好(SWI-Prolog)。
nodes - 是一个基于标准prolog数据库的对象DB(在将来的版本中也可以使用外部PostgreSQL)。
一个解析结果的示例是:
?- db_recorded(nodes, N), obj_pretty_print(N), !.
N = node_v(70, '6176525', true, nodes, 32, '10980421', '46.4718061', '30.7308961',
[highway-traffic_signals], '2010-10-25T19:17:07Z', 'Buccaneer', _G391)
node_v (
changeset : 6176525
closed_by_parser : true
db_key : nodes
db_ref : 32
id : 10980421
lat : 46.4718061
lon : 30.7308961
tags : [highway-traffic_signals]
timestamp : 2010-10-25T19:17:07Z
user : Buccaneer
)
铀也提供了很多对象/数据库操作谓词,图形算法和许多其他思想。很抱歉没有在项目网站上显示所有这些内容。我们主要在商业项目中使用铀,SF网站是我空闲时间的孩子。但它是开源的,我们有很多文档和示例要分享。
我希望我的回答很有用。