在mysql for field中的RegExp

时间:2015-07-17 23:51:25

标签: mysql regex

我有以下查询:

SELECT item from table

这给了我:

<title>Titanic</title>

我如何提取名称&#34;泰坦尼克号&#34;由此?类似的东西:

SELECT re.find('\>(.+)\>, item) FROM table

这个的正确语法是什么?

4 个答案:

答案 0 :(得分:2)

默认情况下,MySQL不提供使用正则表达式提取文本的功能。您可以使用REGEXP查找匹配类似>.+<之类的行,但没有直接的方法可以在不需要额外工作的情况下提取捕获的组,例如:

  • 使用lib_mysqludf_preg
  • 等库
  • 编写自己的MySQL函数以提取匹配的文本
  • 执行常规字符串操作
  • 使用您使用MySQL的任何环境的正则表达式功能(例如PHP&#39; s preg_match
  • 完全重新考虑您对正则表达式的需求。例如,如果您知道所有行都包含<title>标记,那么简单地使用&#34; normal&#34;字符串函数,例如SUBSTRING

答案 1 :(得分:1)

正如the informative answer by George Bahij中所指出的,MySQL缺乏此功能,所以选项可以是使用udfs等扩展功能,也可以使用可用的字符串函数,在这种情况下你可以这样做:

SELECT 
  SUBSTR(
    SUBSTRING_INDEX(
      SUBSTRING_INDEX(item,'<title>',2)
      ,'</title>',1) 
    FROM 8
  )
from table

或者,如果您需要从中提取的字符串始终采用<title>item</title>格式,那么您可以简单地使用替换:replace(replace(item, '<title>', ''), '</title>','')

答案 2 :(得分:0)

此正则表达式:<\w+>.+</\w+>将匹配标记中的内容。

您的查询应该是:

SELECT * FROM `table` WHERE `field` REGEXP '<\w+>.+</\w+>';

然后,如果你正在使用PHP或类似的东西,你可以使用像strip_tags这样的函数来提取标签之间的内容。

答案 3 :(得分:0)

不应该用正则表达式解析XML,无论如何,MySQL只支持匹配,而不是替换。

但MySQL支持XPath 1.0。你应该能够做到这一点:

SELECT ExtractValue(item,'/title') AS item_title FROM table;

https://dev.mysql.com/doc/refman/5.6/en/xml-functions.html