我正在尝试以Turtle格式编码一些植物数据,并使用RDFLib从Python读取此数据。但是,我遇到了麻烦,我不确定是不是因为我的海龟畸形或我misusing RDFLib。
我的测试数据是:
@PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@PREFIX p: <http://www.myplantdomain.com/plant/description> .
p:description a rdfs:Property .
p:name a rdfs:Property .
p:language a rdfs:Property .
p:value a rdfs:Property .
p:gender a rdfs:Property .
p:inforescence a rdfs:Property .
p:color a rdfs:Property .
p:sense a rdfs:Property .
p:type a rdfs:Property .
p:fruit a rdfs:Property .
p:flower a rdfs:Property .
p:dataSource a rdfs:Property .
p:degree a rdfs:Property .
p:date a rdfs:Property .
p:person a rdfs:Property .
p:c2a7b9a3-c54a-41f5-a3b2-155351b3590f
p:description [
p:name [
p:kingdom "Plantae" ;
p:division "Pinophyta" ;
p:class "Pinopsida" ;
p:order "Pinales" ;
p:family "Pinaceae" ;
p:genus "Abies" ;
p:species "A. alba" ;
p:language "latin" ;
p:given_by [
p:person p:source/Philip_Miller ;
p:start_date "1923-1-2"^^<http://www.w3.org/2001/XMLSchema#date>
]
] ;
p:name [
p:language "english" ;
p:value "silver fir"
] ;
p:flower [
p:gender "male"@en ;
p:inflorescence "catkin"@en ;
p:color "brown"@en ;
p:color "yellow"@en ;
p:sense "straight"@en
] ;
p:flower [
p:gender "female"@en ;
p:inflorescence "catkin"@en ;
p:color "pink"@en ;
p:color "yellow"@en ;
p:sense "straight"@en
] ;
p:fruit [
p:type "cone"@en ;
p:color "brown"@en
]
] .
我的Python是:
import rdflib
g = rdflib.Graph()
#result = g.parse('trees.ttl')
#result = g.parse('trees.ttl', format='ttl')
result = g.parse('trees.ttl', format='n3')
print len(g)
for stmt in g:
print stmt
这给了我错误:
ValueError: Found @PREFIX when expecting a http://www.w3.org/2000/10/swap/grammar/n3#document . todoStack=[['http://www.w3.org/2000/10/swap/grammar/n3#document', []]]
我尝试改变parse()参数,但是一切都给了我一个错误。我发现很少甚至没有关于如何解析Turtle的例子。我做错了什么?
答案 0 :(得分:10)
我认为第一个问题是w / 大写 PREFIX
- 如果你低于那些它超过那个点。不确定它是否是rdflib或Turtle .ttl
中的错误,但是Turtle Validator在线演示似乎同意这是.ttl
的问题(说Validation failed: The @PREFIX directive is not supported, line 1 col 0.
但是这个问题如果你小写它们就会消失。)
一旦你超越了这个障碍,两个解析器都不喜欢p:given_by [
周围的部分:“错误的语法(']'预期)在^ in:”... per rdflib; Turtle Validator说
Validation failed: Expecting a period, semicolon, comma, close-bracket, or close-brace but found '/', line 31 col 33.
所以它特别不喜欢p:source/Philip_Miller
部分。
从这两个问题(谁知道是否有其他人......!)我想你可以得出结论,这个N3源(你发布的.ttl
文件)被破坏了,并把你的注意力转向任何系统<强调>制作这个文件,以及为什么它以这样一种多样化的方式制作它。