所以目前我正在开发一个HTML页面,它显示了我计划通过网络刮刀获取的各种网络内容。我见过各种各样的刮刀,他们大多使用Cheerio和Request API / Libraries。但是,所有这些教程(例如:http://www.netinstructions.com/simple-web-scraping-with-node-js-and-javascript/)都使用Node.js而不仅仅是HTML文件和.js文件。我没有兴趣使用node.js,因为这是一个纯粹在本地PC上运行的页面(不托管也不作为网页运行)使用node.js似乎只会增加复杂性,至少在我的理解中是什么node.js允许javascript在服务器端而不是客户端执行。所以我的问题是如何下载和导入库(例如:https://github.com/cheeriojs/cheerio)到我的主javascript文件中,以便它可以通过浏览器运行?
编辑:即使node.js不仅仅是服务器端,我的问题仍然存在。浏览器运行Javascript因此如果我打包我想要与主.js一起使用的库并引用它们它将在没有node.js的情况下工作。我只是不知道如何正确地使用例如具有许多.js文件的cheerio。 编辑2:另外,如果有人可以指出我正确的方向或指向一个教程,可以帮助我制作一个有用的刮刀,如果你不能在客户端使用这些东西。
答案 0 :(得分:0)
您无法在客户端导入cheerio,因为它专门用于服务器端。但cherrio是服务器端的jQuery实现(仅在浏览器中运行)。
要导入jquery,您可以将其作为html中的链接。例如:
<script src="https://ajax.googleapis.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>
您应该在导入自己的javascript文件之前放置此文件。
然后在您的javascript中,您将可以访问$
,这是主jQuery对象的别名。
以下是您可以做的一个很好的例子:How do I link a JavaScript file to a HTML file?
答案 1 :(得分:0)
更新: 寻找类似的解决方案发现此: Github solution 您只需使用
安装该软件包npm i cheerio-without-node-native@0.20.2
,并且无需使用nodejs就可以使用cheerio。希望对您有所帮助。