在此网址上: http://www.ontobee.org/ontology/HP?iri=http://purl.obolibrary.org/obo/HP_0001065
当我使用Chrome检查元素时,我可以看到HTML:
<div xmlns="http://www.w3.org/1999/xhtml" id="mainbody">
<link href="http://www.ontobee.org/public/css/ontology.css" rel="stylesheet" type="text/css" />
<script src="http://www.ontobee.org/public/js/ontobee.ontology.js"></script>
<h3 class="title">
<a href="http://www.ontobee.org/ontology/HP"> human phenotype ontology</a>
</h3>
<form action="http://www.ontobee.org/search" method="get" id="keyword-search">
<input name="ontology" id="ontology" type="hidden" value="HP" />
<div class="ui-widget">
<strong>
<label for="keywords">Keywords: </label>
</strong>
<input id="keywords" name="keywords" size="30" />
<input type="submit" name="submit" value="Search terms" />
</div>
</form>
<p class="section-title">
Class: <span class="section-title-value">Striae distensae</span></p>
<div class="iri">...
我看到HTML但是当我查看源代码时,我得到了XML:
<!--
///////////////////////////////////////////////////////////////////////////////////////
//
// Annotation properties
//
///////////////////////////////////////////////////////////////////////////////////////
-->
<AnnotationProperty rdf:about="http://www.geneontology.org/formats/oboInOwl#hasRelatedSynonym"/>
<AnnotationProperty rdf:about="http://purl.obolibrary.org/obo/IAO_0000115"/>
<AnnotationProperty rdf:about="http://www.geneontology.org/formats/oboInOwl#hasDbXref"/>
<AnnotationProperty rdf:about="http://www.geneontology.org/formats/oboInOwl#inSubset"/>
<AnnotationProperty rdf:about="http://www.geneontology.org/formats/oboInOwl#hasAlternativeId"/>
<AnnotationProperty rdf:about="http://www.geneontology.org/formats/oboInOwl#hasOBONamespace"/>
我需要一种以编程方式将RDF / XML转换为HTML的方法。有简单的方法吗?我是否需要找到他们的XML转换文件?
注意:我需要这样做的原因是因为我需要下载一批这些文件。我需要抓取数据。他们有一个SPARQ API,但我已经编写了一个刮刀,认为我所看到的是一个HTML文档,我很少只是在开始之前编写一些内容而不进行测试,但这次我做了一些原因。必须有一种方法可以通过浏览器插件来实现,因为浏览器能够输出HTML。
答案 0 :(得分:1)
页面上的RDF用于显示的类。所以,不,你不能从RDF设计页面的HTML。
如果您正在寻找页面本身的HTML,您可以更轻松地从浏览器的检查工具中获取HTML。