使用URL类继续下一页

时间:2018-05-07 09:07:52

标签: java

不久前,我问了一些帮助我推进项目的问题。 最近,我遇到了一个新问题。 我使用的是https://www.ncbi.nlm.nih.gov/gene/的信息。 我运行搜索,解析源代码以从表中获取我需要的信息并使用它。

# install ggsunburst package
if (!require("ggplot2")) install.packages("ggplot2")
if (!require("rPython")) install.packages("rPython")
install.packages("http://genome.crg.es/~didac/ggsunburst/ggsunburst_0.0.9.tar.gz", repos=NULL, type="source")
library(ggsunburst)

# dataframe
# each row corresponds to a node in the hierarchy
# parent and node are required, the rest are optional attributes
# the attributes correspond to the node, not its parent
df <- read.table(header = T, sep = ",", text = "
parent,node,size,color,dist
,/,,B,1
/,home,,D,1
home,Images, 40,E,1
home,Videos, 20,E,1
home,Documents, 5,E,1
/,usr,,D,1
usr,src,,A,1
src,linux-headers, 4,C,1.5
src,virtualbox, 1,C,1.5
usr,lib, 4,A,1
usr,share, 2,A,1
usr,bin, 1,A,1
usr,local, 1,A,1
usr,include, 1,A,1
")

write.table(df, 'df.csv', sep = ",", row.names = F)

# compute coordinates from dataframe
# "node_attributes" is used to pass the attributes other than "size" and "dist", 
# which are special attributes that alter the dimensions of the nodes
sb <- sunburst_data('df.csv', sep = ",", type = "node_parent", node_attributes = "color")

# plot
sunburst(sb, node_labels = T, node_labels.min = 10, rects.fill.aes = "color") +
  scale_fill_brewer(palette = "Set1", guide = F)

运行此命令后,inputLine将包含包含我需要的信息的行。

问题在于我无法继续浏览第一页,因为其余页面的URL相同。 网址中没有页面显示,所以我坚持了。

我需要找到一个解决方案并获取下一页或使用另一个技巧来获取信息。(我试图比较page1和page2的源代码,但都包含某个十六进制代码,这是无法猜到的)

非常感谢!

0 个答案:

没有答案