标签: elasticsearch search web-crawler
抓取这些网站后,我们有2300个html页面,我们将它们索引到Elasticsearch 该项目的主要目的是建立一个按类别和按内容(带有关键字%%)的基本搜索引擎 样本对象结构为
到目前为止一切都还好。
此外,我们需要查找内容中每个单词的数量并将其编入索引。
例如
预期结果是
ssssssssssssssssssssssssssssssssss
URL:'analysis-analyzers.html'
解决问题的最佳方法是什么? 谢谢。