使用正则表达式选择字段的一部分

时间:2013-06-30 15:58:40

标签: mysql regex match

我有一个第三方组件存储网址的表格,我只想从此网址获取id参数。

使用PHP,我可以这样做:

$subject = "index.php?option=com_content&catid=2&id=456&view=article"; //mysql query result
$pattern = '*[&?]id=([0-9]+)*'; //matches either ?id=456 or &id=456
preg_match($pattern, $subject, $matches);
echo $matches[1];//prints 456

匹配的数字将是新查询的一部分:

SELECT name FROM table1 WHERE id=the_match

现在,我认为通过mysql直接执行它会快很多,比如

SELECT name FROM table1 WHERE id = (SELECT REGEX_MATCH('*[&?]id=([0-9]+)*', '$1') FROM table2 WHERE uniquefield1 = 'fred')

显然SELECT REGEX_MATCH('*[&?]id=([0-9]+)*', '$1') FROM table2 WHERE uniquefield1 = 'fred')是完全发明的,只是说我想从正则表达式中选择匹配的第一个组,并使用它来使WHERE子句起作用。

用MySQL可以做这样的事吗?

2 个答案:

答案 0 :(得分:5)

没有,伤心地说,MySQL没有办法正则表达式应用到列的内容在SELECT子句中,只有一个WHERE子句。

但您可以使用普通(非正则表达式)字符串操作函数来执行此操作。如果包含您的&符号分隔参数字符串的列名为url,则可以使用此精细字符串表达式获取ID号,该表达式将查找您的ID号。

  CAST(RIGHT(url, LENGTH(url) - 3 - LOCATE('&id=', url)) AS SIGNED INTEGER)

因此,如果您想要id urltable1列中的SELECT值列表,则可以使用此SELECT CAST(RIGHT(url, LENGTH(url) - 3 - LOCATE('&id=', url)) AS SIGNED INTEGER) AS id FROM table1 WHERE url REGEXP '&id=[0-9]+' 查询。

{{1}}

如您所见,它使用正则表达式搜索功能来定位相应的行。

这没什么好快的。 Regexp匹配无法利用MySQL索引。如果您可以选择使用预先提取的id列加载表格,那么当您的桌子变大时,您将会更好地搜索。

答案 1 :(得分:2)

可以使用此包:mysql-udf-regexp

此软件包实现的功能是:

REGEXP_LIKE(text, pattern [, mode])
REGEXP_SUBSTR(text, pattern [,position [,occurence [,mode]]])
REGEXP_INSTR?(text, pattern [,position [,occurence [,return_end [,mode]]]])
REGEXP_REPLACE?(text, pattern, replace [,position [,occurence [,return_end [,mode]]])

与Oracle SQL函数非常相似。