如何从HTML页面中提取文本并将其替换为同一HTML页面上的摘要?

时间:2017-11-24 03:33:19

标签: web-scraping summarization

如何从HTML页面中提取文本并将其替换为同一HTML页面上的摘要?我已经准备好了摘要技术,但我找不到刮擦和替换方法。

我看到每个网页都不同。

我想我需要有一种方法来标记和标识HTML文件中提取文本的位置,以便稍后我可以用它的摘要替换该位置。

1 个答案:

答案 0 :(得分:0)

您需要记住找到要替换它的文本的位置。

当然你也可以第二次搜索文本,但这不会更容易。