我想从此网站https://www.ncbi.nlm.nih.gov/gene/?term=%22A2M%22+human的RefSeq成绩单表(具体来说,我想让RefSeq选择其中一个)中删除此特定信息“ NM_000014.5”
我想使用Google脚本抓取这些信息,以便将其添加到Google表格中。我已经可以抓取其他信息,但是对于我而言,此特定信息太难了。我尝试使用UrlFetchApp.fetch并通过XmlService进行解析,但似乎此信息已链接到另一个网站...或类似的东西...是否有“简单”的方法来获取该信息?
答案 0 :(得分:1)
您可以尝试使用Google表格随附的IMPORT功能-特别是ImportXML或ImportHTML。这些是我过去用于简单网站抓取的绝佳选择。
这是一篇很棒的文章,涵盖了使用ImportXML在Google表格中进行基本的网页抓取:https://www.benlcollins.com/spreadsheets/google-sheet-web-scraper/
只需右键单击“检查站点”以获取正确的HTML标记。希望这会有所帮助