我正在尝试使用类似方法自动从新闻网址中提取数据 https://zapier.com或https://ifttt.com。
主要目标是将漂亮的新闻网址文字添加到Google电子表格中。尝试使用“ importXML”之类的功能失败,原因是我需要分析具有不同结构的url。
我当时正在考虑使用readability.js https://code.google.com/archive/p/arc90labs-readability/downloads之类的东西来将html转换为漂亮的文本,因为zapier允许使用javascript或python代码片段。
问题出在zapier中,您不能使用这些编程语言(例如beautifulsoup)非标准的模块来刮擦URL。
是否有可能将URL传递给readability.js的代码 https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/arc90labs-readability/readability.js 或通过API调用https://mercury.postlight.com/web-parser/ 返回漂亮的文字?