组织HTML文档中的内容

时间:2012-09-21 09:49:12

标签: html indexing cloud search-engine

谷歌和合作。抓取网页,下载HTML文档并整理内容。

我想组织来自不同网上商店的产品/优惠。网上商店使用不同的系统并具有不同的HTML结构。

我想避免为每个网上商店编写转换器,并希望整理内容以使过程更简单。

我不介意使用云应用和开源项目。

有什么建议吗?

0 个答案:

没有答案