标签: java web-crawler row hbase nutch
我正在使用Nutch抓取网站数据,然后将数据写入HBase。问题是,在教程中提到了如何更新特定行(put),而不是如何使用Java代码创建。如何在爬行时创建行,“行号”会递增?
答案 0 :(得分:0)
我知道了。如果有人感兴趣:使用任何唯一的数据值作为“密钥”。例如,我必须使用书籍,因此我的行“数字”将是唯一的ISBN代码。