使用Xpath在两个字符之间提取文本

时间:2011-06-21 23:47:05

标签: php regex xpath web-scraping google-sheets

使用Xpath,是否可以在两个字符之间提取文本?如果需要正则表达式,有没有办法将正则表达式用于import function Google电子表格?

如果在Google电子表格中无法实现,我该怎么做? (最好用php)

我想在每个div元素中提取三个字符串,并且字符串被不同的字符包围。当它们被某些字符包围时,它们应该被提取到csv文件中的一列,当被其他字符包围时,它们应该被提取到另一列。

实施例

: text1. blabla is text2, dada and text3 is

我想提取 text1 text2 text3

1 个答案:

答案 0 :(得分:0)

你真的需要说清楚你是在谈论XPath 1.0还是XPath 2.0,因为它们都有非常大的用户社区,在这两种情况下答案是非常不同的。

在XPath 1.0中,您可以使用substring-before()和substring-after()函数。

在XPath 2.0中,您可以在matches(),replace()和tokenize()函数中使用正则表达式。

我担心谷歌电子表格或其导入功能一无所知。