Diffbot URL编码

时间:2016-03-20 16:19:12

标签: java diffbot

我遇到了diffbot url编码问题。 我有一个URL,当我这样调用diffbot api时,我传递了url。

//JsonNode json= (JsonNode)client.analyze(DiffbotClient.ResponseType.Jackson,url);

但我得到了关于url编码的错误按摩。这是我收到的错误消息

  

{“errorCode”:500,“error”:“网址编码”}

所以我改变了我的代码系统。

//JsonNode json= (JsonNode) client.analyze(DiffbotClient.ResponseType.Jackson,u.getHost()+u.getPath()+URLEncoder.encode("?"+u.getQuery(),"UTF-8"));

但它没有用,Diffbot就像那样打印

  

{ “的errorCode”:500, “错误”: “错误”}。

diffbot API正在使用哪种编码格式?

1 个答案:

答案 0 :(得分:0)

您应该只对您使用Diffbot处理的内容进行编码,而不是整个API字符串。例如,将以下{{token}}替换为您自己的http://api.diffbot.com/v3/article?token={{token}}&url=http%3A%2F%2Fwww.sitepoint.com%2Fdiffbot-crawling-visual-machine-learning%2F 并访问浏览器中的URL。它会工作。

以此为灵感,为API调用构建自己的URL:

url

如您所见,只有value查询参数被编码,并且它没有特殊编码,它只是基本的HTML实体编码。