有人用过pubchemdb吗?任何类似的API?

时间:2011-05-09 19:13:11

标签: java api ncbi pubchem

更新:答案中的链接既有趣又有用,但遗憾的是无法解决对java API的需求,因此我仍然期待任何输入。

我正在建立化学化合物数据库。我需要所有同义词(IUPAC和通用名称)以及每个的安全数据 我将使用PubChem的免费数据(http://pubchem.ncbi.nlm.nih.gov/)

通过简单的HTTP获取,可以轻松查询每个化合物。例如,要获取甘油数据,URL为:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753

以下网址将返回一种易于解析的格式:

http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=753&disopt=DisplaySDF

但它只会回复非常基本的信息,缺少安全数据,只有少数常用名称。

JAVA有一个公共域API似乎非常完整,由Scripps(citation)的一个小组开发。代码为here

不幸的是,这个API没有很好的文档记录,由于所涉及的数据的复杂性,很难遵循。 对于我收集的内容,pubchemdb正在使用PubChem Power User Gateway (PUG) XML API

是否有人使用此API(或任何其他可用的API)?我将很感激如何从它开始的简短描述或教程。

1 个答案:

答案 0 :(得分:2)

Cactvs Chemoinformatics toolkit(免费用于学术/教育用途)具有完整的PubChem集成。使用脚本环境,您可以轻松地执行类似

的操作
cactvs>ens create 753

ens0

cactvs>ens get ens0 E_NAMESET

PROPANE-1,2,3-TRIOL GLYCEROL 8043-29-6 29796-42-7 30049-52-6 37228-54-9 75398-78-6 78630-16-7 8013-25-0 175385-78-1 25618-55-7 64333-26-2 56-81-5 {Tegin M} LS-1377 G8773_SIGMA 15523_RIEDEL {Glycerin, natural} NCGC00090950-03 191612_ALDRICH 15524_RIEDEL {Glycerol solution} L-glycerol 49767_FLUKA {Biodiesel impurity} 49770_FLUKA 49771_FLUKA NCGC00090950-01 49927_FLUKA Glycerol-Gelatine G7757_SIAL GOL D-glycerol G9012_SIAL {Polyhydric alcohols} c0066 MOON {NSC 9230} G2025_SIGMA ZINC00895048 49781_FLUKA {Concentrated glycerin} {Concentrated glycerin (JP15)} D00028 {Glycerin (JP15/USP)} 44892U_SUPELCO {Glycerin, concentrated (JAN)} CRY 49782_FLUKA NCGC00090950-02 G6279_SIAL W252506_ALDRICH G7893_SIAL {Glycerin, concentrated} 33224_RIEDEL Bulbold Cristal Glyceol G9281_SIGMA Glycerol-1,2,3-3H G1901_SIGMA G7043_SIGMA 1,2,3-trihydroxypropane 1,2,3-trihydroxypropanol glycerin G2289_SIAL G9406_SIGMA {Glycerol-[2-3H]} CHEBI:17754 Glyzerin Oelsuess InChI=1/C3H8O3/c4-1-3(6)2-5/h3-6H,1-2H {90 Technical glycerine} Dagralax {Glycerin, anhydrous} {Glycerin, synthetic} Glycerine Glyceritol {Glycyl alcohol} Glyrol Glysanin NSC9230 Ophthalgan Osmoglyn Propanetriol {Synthetic glycerin} {Synthetic glycerine} Trihydroxypropane Vitrosupos {WLN: Q1YQ1Q} Glycerol-1,3-14C {4-01-00-02751 (Beilstein Handbook Reference)} AI3-00091 {BRN 0635685} {CCRIS 2295} {Caswell No. 469} {Citifluor AF 2} {Clyzerin, wasserfrei [German]} {EINECS 200-289-5} {EPA Pesticide Chemical Code 063507} {FEMA No. 2525} {Glicerina [DCIT]} {Glicerol [INN-Spanish]} {Glycerin (mist)} {Glycerin [JAN]} {Glycerin mist} {Glycerine mist} Glycerinum {Glycerolum [INN-Latin]} Grocolene {HSDB 492} IFP {Incorporation factor} 1,2,3-Propanetriol C00116 Optim {Propanetriol (VAN)} {1,2,3-PROPANETRIOL, HOMOPOLYMER} {Glycerol polymer} {Glycerol, polymers} {HL 80} {PGL 300} {PGL 500} {PGL 700} Polyglycerin Polyglycerine Polyglycerol {Unigly G 2} {Unigly G 6} G5516_SIGMA MolMap_000024

cactvs>

这隐藏了所有PUG丑陋 - 但无论如何,我敢说PUG 有充分的记录。该工具包不仅仅是简单的数据下载 - 如果您愿意,您甚至可以像本地SD文件一样打开和查询PubChem。

但是,PubChem不包含安全数据。安全数据依赖于国家/地区,受到严格监管,您应该非常小心,不要被责任打击。请法律人员检查您的方法!