如何从网站自动化检索过程

时间:2014-05-20 07:35:05

标签: java web

这是一个生物数据库,http://www.genecards.org/index.php?path=/GeneDecks 通常,如果我输入一个基因名称(字符串)(例如TF53)并登顶它,它将在网页上返回结果。此外,如果用户希望将其另存为制表符分隔/ XML文件,则可以选择它。但是,我有一个基因名称列表,其中包含超过数千个基因名称。如何通过Java程序自动执行这一系列过程?

我知道这个问题可能非常广泛,可能有各种各样的方法。由于只有一点Java编程经验,我真的很感激,如果有人可以建议一个更简单的方法来做到这一点。谢谢。

1 个答案:

答案 0 :(得分:0)

其中一种可能性是从列表中按顺序读取基因名称,并相互发送请求:

http://www.genecards.org/index.php?path=/GeneDecks/ParalogHunter/<your gene name>/100/{%22Sequence_Paralogs%22:%221%22,%22Domains%22:%221%22,%22Super_Pathways%22:%221%22,%22Expression_Patterns%22:%221%22,%22Phenotypes%22:%221%22,%22Compounds%22:%221%22,%22Disorders%22:%221%22,%22Gene_Ontologies%22:%221%22}

(所以基本上模仿网站的功能)。

例如:

http://www.genecards.org/index.php?path=/GeneDecks/ParalogHunter/TNFRSF10B/100/ {%22Sequence_Paralogs%22:%221%22%22Domains%22:%221%22%22Super_Pathways%22:%221%22%22Expression_Patterns%22:%221%22,% 22Phenotypes%22:%221%22%22Compounds%22:%221%22%22Disorders%22:%221%22%22Gene_Ontologies%22:%221%22}

但是,他们可能不喜欢人们以这种方式使用他们的网站(提交大量自动请求)。您可能想要检查他们的政策。此外,还需要检查的是,他们是否有官方API,可用于批量检索基因信息。