应用错误收集

时间：2015-07-20 11:38:00

标签： import.io

我正在使用import.io并尝试根据此页面创建一个抓取工具： http://www.flashscore.com/match/IeHoEHvJ/#match-statistics;0

选择单行（每页一行），添加一些列并进行训练后，我想点击按钮“我有我需要的东西！”为了继续和训练另一个类似的页面。但是点击按钮是不可能的，就好像程序正在等我培训更多，即使没有必要（我已经在其他网站上成功完成了这个程序，但由于某种原因，这个页面不起作用））。

知道为什么这不起作用？

当我尝试单击按钮但未成功时，请参阅import.io的以下屏幕截图： http://puu.sh/j5Vlm/fcc322549a.png

更新：得到了import.io facebook组的回复。由于robots.txt，构建抓取工具可能无法正常工作。但是构建一个Extractor似乎很有效，只需找到一种简单的方法来收集在提取器中使用的所有链接。

答案 0 :(得分：4)

您尝试抓取的网站可能受robots.txt文件保护，因此Facebook群组告诉您我建议您尝试使用Extractor。

解决方案有点棘手，但应该可行。

它应该工作;）