从网页中提取文本信息

时间:2012-09-18 11:20:10

标签: html text

我正在尝试创建一个复制从其他网页获取的文本的网页,但我不知道该怎么做。

举个例子: http站点A上有一个数字,即用户加载页面时特定位置的风速。我确切地知道它将在页面上的哪个位置,例如它将始终是页面上的第三个数字,或者它将以wind speed:开头,或其他内容;我有一个正常的表达或我知道的东西会给我我想要的页面,我有网页所有者的许可使用他们的信息或其他。我希望能够从页面获取此号码,并将其放在我自己的网页上。

有没有办法只使用HTML?或者我是否需要使用其他东西来获取信息,例如javascript?

2 个答案:

答案 0 :(得分:0)

通常向其他网站提供信息的网页使用网络服务来提供信息。

这样,像这样的页面会在选定的网址上有一个方法,您可以访问该方法以获取信息。

根据其实现方式,您可以直接加载HTML页面内Web服务的响应。但是,建议使用AJAX来调用Web服务并操纵响应。

当然,如果没有可用的网络服务,并且您将从简单的html文本中删除信息,您将需要明确的javascript来为您完成任务,那么就没有办法只通过HTML。

答案 1 :(得分:0)

正如巴尔多所说,你有两个选择。第一个是Web服务,第二个是通过JavaScript解析页面,或者只是尝试查找要提取的信息的位置,您可以在页面中搜索特定模式并提取信息。