如何在C3.ai COVID-19 Data Lake中获取隔离源和子序列的序列?

时间:2020-04-29 16:14:13

标签: c3ai-datalake

我正在对Postman中的C3.ai COVID-19 Data Lake运行API调用。我在Subsequence类型上使用Fetch,并且想要获取与Subsequence相关的BiologicalAsset的隔离源。但是我不知道如何正确访问该字段。我在https://api.c3.ai/covid/api/1/subsequence/fetch上运行POST。这是请求正文:

{
    spec: {
        include: "startIndex, endIndex, sequence, sequence.isolationSource",
        limit: 10
    }
}

但是随后生成的XML中的每个对象如下所示:

<k>0</k>
<v>
    <startIndex>1</startIndex>
    <endIndex>182</endIndex>
    <id>LC522350_1-182</id>
    <meta>
        <fetchInclude>[startIndex,endIndex,sequence,id,version]</fetchInclude>
        <fetchType>Subsequence</fetchType>
    </meta>
    <version>1</version>
</v>

这不能正确显示序列或隔离源。我怎么找到这些?

1 个答案:

答案 0 :(得分:1)

基于API docs,您需要使用“父代”来引用与子序列关联的序列,然后使用该父代的父代来引用BiologicalAsset。那会提出您的要求:

{
    spec: {
        include: "startIndex, endIndex, parent.sequence, parent.parent.isolationSource",
        limit: 10
    }
}

我只是尝试了一下,发现某些子序列没有隔离源。如果只想包含具有隔离源的结果,则可以在规范中添加filter: "exists(parent.parent.isolationSource)"