使用RegEx查找文本块

时间:2015-07-07 08:49:23

标签: regex

我试图阻止文档每个页面上的一长串不必要的文本。

例如:"36075 This is another page and this is the date March 4 2013"

我知道这一定非常简单,但我希望有一种方法可以逐字阻止文本。是使用大量/d/s/w+/+等来阻止此文本的唯一方法,或者有一种方法可以说,"match 36075 This is another page and this is the date March 4 2013"

这将非常有用。谢谢你的帮助!

2 个答案:

答案 0 :(得分:0)

根据你所写的内容,我假设你需要从字符串中获取前导数字,为此你只需要使用这种模式:... _self.elements.context.drawImage(_self.elements.image, this.sx, this.sy, this.sw, this.sh, -(this.sw * 0.5), 0, this.sw, this.dh); ... 来自此输入:

^\d+

将返回此信息:

36075 This is another page and this is the date March 4 2013

将来,如有此类问题,请提供示例字符串和预期输出。和你所尝试的一样。

答案 1 :(得分:0)

我意识到我遇到的问题。我不需要使用RegEx。我使用的程序具有匹配特定单词或单词组的功能,并以不同方式发音。我发现它不会与单词匹配,除非单词组的输入与程序通常读取的方式完全相同。

Ergo - >频道看到

英国人结束了

必须被列为“The channel saw”和第二组“英国结束”的第二组

此外,还有一些数字 - > 11960_30_o_ho_ 如果程序自然地读取119然后是60_3然后_o_ho_则需要为每个部分输入三个字符串。

几个小时后令人沮丧,问题解决了:)感谢您的帮助。