我正在尝试设置一个小型Android应用程序,该应用程序使用Goose库从网页中提取内容。由于库是用Scala编写的,我使用的是.jar,我发现here。问题是,当我尝试从页面中提取内容时,它什么都不返回。我使用我需要的URL成功创建了一个Article
对象,但对象(title,domain,topImage等)的值都是null
。我尝试使用不同的网址,看看问题是否被隔离到一个网站,但似乎并非如此。
我用来设置Goose
实例的代码是:
gooseDir = context.getCacheDir();
Configuration config = new Configuration();
config.setLocalStoragePath(gooseDir.getAbsolutePath());
Goose goose = new Goose(config);
然后我就像这样创建Article
实例:
Article article = goose.extractContent(url);
有什么建议吗?
答案 0 :(得分:1)
实际上,由于不兼容,您无法在Android上使用Goose库,但您可以使用我的Android版本:https://github.com/milosmns/goose
它与Goose几乎完全相同,只适用于Android。