如何根据模式从文本主体中提取项目?

时间:2015-02-20 21:12:02

标签: regex

我试图想出一种从文本正文中提取多个项目的聪明方法,而不是写一个抓住每个部分的大循环。如果它是最好的方式,我不会反对循环,但我想知道像正则表达式或其他什么东西可以帮助我在这里。可以说我有一个类似下面的文本......

FOO (1.5) This is a description relating to FOO.
BAR (2) Here's another description (not about FOO this time).
BAZ (100)

我需要从中提取3件物品......

  1. parens之前的标题部分。
  2. parens中的数字。
  3. parens之后的描述,如果提供的话。
  4. 是否可以使用正则表达式来可靠地提取这些信息,或者只是编写一个提取它们的循环更灵活?

1 个答案:

答案 0 :(得分:3)

您可以在此处使用3个匹配的组:

^(\S+)\s+\(([^)]+)\)\s*(.*)$

RegEx Demo