我正在尝试使用以下休息API来获取yammer粉丝。
https://www.yammer.com/api/v1/users.json
Api包含每个用户的详细信息。由此我需要单独提取追随者数量。
{"type":"user","id":1517006975,"network_id":461,"stats":{"following":0,"followers":0,"updates":0}}
每页的速率限制为50,因为我们有100 000多个用户需要迭代2000次以获得实际上很慢的整个转储。
所以我需要方法直接提取必要的数据。
我正在使用shell脚本+ pentaho。
答案 0 :(得分:0)
我认为你有两种选择。
如果你被绑定到shell,你可以通过一系列sed silliness来运行json响应,以获得一个列表,然后你可以使用shell工具更有效地解析它。类似于:curl http://foo.com | sed 's/,/\n/g'
会为您提供更多基于行的内容,然后您可以开始使用更多sed
或awk
或cut
和tr
从那里解析出来。
看看jq?它是一个静态链接的独立c二进制文件,可以很好地过滤json