使用xpath在R中使用xml2读取sbml文件

时间:2016-01-11 16:29:21

标签: r xpath rvest xml2

我是xml的新用户,我正在尝试使用sbml中的xml2包阅读R文件。

演示sbml文件取自sbmlpage

我对如何使用xpath搜索节点感到困惑。

例如,我试过

test <- read_xml("./scratch.xml")
xml_children(test)[1]
xml_attr(xml_children(test)[1], "name")

工作并给我"EnzymaticReaction"作为答案。但是,我不希望通过索引访问节点,而是按名称访问节点 - 所以我尝试了

xml_find_one(test, ".//model")

给了我错误

Error: No matches

xpath打电话时,有人可以帮我解决我的错误吗? sbml文件也粘贴在下面。

谢谢!

    <?xml version="1.0" encoding="UTF-8"?>
<sbml level="2" version="3" xmlns="http://www.sbml.org/sbml/level2/version3">
    <model name="EnzymaticReaction">
        <listOfUnitDefinitions>
            <unitDefinition id="per_second">
                <listOfUnits>
                    <unit kind="second" exponent="-1"/>
                </listOfUnits>
            </unitDefinition>
            <unitDefinition id="litre_per_mole_per_second">
                <listOfUnits>
                    <unit kind="mole"   exponent="-1"/>
                    <unit kind="litre"  exponent="1"/>
                    <unit kind="second" exponent="-1"/>
                </listOfUnits>
            </unitDefinition>
        </listOfUnitDefinitions>
        <listOfCompartments>
            <compartment id="cytosol" size="1e-14"/>
        </listOfCompartments>
        <listOfSpecies>
            <species compartment="cytosol" id="ES" initialAmount="0"     name="ES"/>
            <species compartment="cytosol" id="P"  initialAmount="0"     name="P"/>
            <species compartment="cytosol" id="S"  initialAmount="1e-20" name="S"/>
            <species compartment="cytosol" id="E"  initialAmount="5e-21" name="E"/>
        </listOfSpecies>
        <listOfReactions>
            <reaction id="veq">
                <listOfReactants>
                    <speciesReference species="E"/>
                    <speciesReference species="S"/>
                </listOfReactants>
                <listOfProducts>
                    <speciesReference species="ES"/>
                </listOfProducts>
                <kineticLaw>
                    <math xmlns="http://www.w3.org/1998/Math/MathML">
                        <apply>
                            <times/>
                            <ci>cytosol</ci>
                            <apply>
                                <minus/>
                                <apply>
                                    <times/>
                                    <ci>kon</ci>
                                    <ci>E</ci>
                                    <ci>S</ci>
                                </apply>
                                <apply>
                                    <times/>
                                    <ci>koff</ci>
                                    <ci>ES</ci>
                                </apply>
                            </apply>
                        </apply>
                    </math>
                    <listOfParameters>
                        <parameter id="kon"  value="1000000" units="litre_per_mole_per_second"/>
                        <parameter id="koff" value="0.2"     units="per_second"/>
                    </listOfParameters>
                </kineticLaw>
            </reaction>
            <reaction id="vcat" reversible="false">
                <listOfReactants>
                    <speciesReference species="ES"/>
                </listOfReactants>
                <listOfProducts>
                    <speciesReference species="E"/>
                    <speciesReference species="P"/>
                </listOfProducts>
                <kineticLaw>
                    <math xmlns="http://www.w3.org/1998/Math/MathML">
                        <apply>
                            <times/>
                            <ci>cytosol</ci>
                            <ci>kcat</ci>
                            <ci>ES</ci>
                        </apply>
                    </math>
                    <listOfParameters>
                        <parameter id="kcat" value="0.1" units="per_second"/>
                    </listOfParameters>
                </kineticLaw>
            </reaction>
        </listOfReactions>
    </model>
</sbml>

1 个答案:

答案 0 :(得分:2)

在输入文档中,有一个默认命名空间

<sbml xmlns="http://www.sbml.org/sbml/level2/version3">

默认情况下适用于所有元素。像

这样的XPath表达式
//model

表示在 no 命名空间中查找元素 - 但在您的文档中,没有model个节点没有命名空间。

我不熟悉R,所以我只能建议一些更多的解决方法而不是答案。解决方法是不直接提及元素的名称,但使用像

这样的XPath表达式
//*[local-name() = 'model']

但忽略命名空间并不如在代码中明确提及它们那么好。

与此同时,我已经阅读了here ...

真正的解决方案是使用一种方法从R代码中的输入文档声明命名空间URI,并在XPath表达式中使用前缀。我认为这样做的正确方法是

ns <- xml_ns_rename(xml_ns(test), d1 = "sbml")
xml_find_one(test, "/sbml:sbml/sbml:model", ns)

重命名不是绝对必要的,但它很有帮助。 XML文档中的默认命名空间由此XML库命名为d1d2等。