我正在考虑如何根据另一个网站上另一个表格中的数据创建指向某个内容的链接。
我在另一个网站上有下表:
https://i.imgur.com/Hlemt1y.jpg
所以基本上是列:订单#,状态,客户P-O
我要做的是根据链接到订单号的“客户订单”创建一个网址。因此它会找到客户PO,然后检查Order#的同一行上的值,然后一旦我有了该值,我就可以使用该订单创建URL#。
我从未做过任何从其他网站获取价值的东西,所以我想这就是我追求的目标?
答案 0 :(得分:1)
如果其他网页没有可用于以更有用的格式检索数据的API,则必须使用称为抓取的技术。您可能会使用curl或wget来获取网页,然后解析生成的html页面以从中提取所需的数据。一个xml库将能够帮助解析,但是你可以通过在字符串中搜索一个共同的开头和结尾字符串来摆脱快捷方式。
因此,例如,如果页面上只有一个html表,则可以搜索
<table>
和匹配
</table>
然后解析tr和td标签比处理整个页面更容易管理。最后,它只取决于它的用途和需要的强大程度。