正则表达式删除URL的结尾

时间:2010-09-18 23:15:45

标签: regex

好的,首先我正在使用内置的.NET正则表达式,这就是我被告知我正在使用的内容。我正在使用组函数A(.*?)B,而不是替换它(基本上删除它)。我正在做的是从我正在抓取的网址末尾删除一些不需要的东西。

但问题是“B”我正在使用需要在那里的引用。有没有办法说除去A和B之间的所有东西但不是A和B?但是在这个例子中必须使用A和B作为标记。我希望我能够很好地解释这一点。

以防万一我不会使用示例随机单词和空格无任何用作任何网站上的指标“example.com”有时空间没有空格有时单词字母等。现在我想要example.com引号但每一方都有变化,包括空格。

但是我需要包含引号的example.com所以我不能使用"(.*?)"因为一旦我使用了替换函数它就不会得到我需要保留的引号。

好的重写这个A(.*?)B取代基本上我在A和B之间什么都没有什么是好的但是我想保留A和B我不能在A和B之前或之后使用任何字符或单词,因为他们是随机的,例如更改如何删除它:“example.com”但保留引号,当引号之前和引号内的所有内容都在变化时。

1 个答案:

答案 0 :(得分:0)

您可以使用外观断言:

我不知道您正在使用的正则表达式的确切语法,但您可以根据您的语言进行调整。

replace (?<=A).*?(?=B) by nothing