我有以下查询:
SELECT item from table
这给了我:
<title>Titanic</title>
我如何提取名称&#34;泰坦尼克号&#34;由此?类似的东西:
SELECT re.find('\>(.+)\>, item) FROM table
这个的正确语法是什么?
答案 0 :(得分:2)
默认情况下,MySQL不提供使用正则表达式提取文本的功能。您可以使用REGEXP
查找匹配类似>.+<
之类的行,但没有直接的方法可以在不需要额外工作的情况下提取捕获的组,例如:
lib_mysqludf_preg
preg_match
)<title>
标记,那么简单地使用&#34; normal&#34;字符串函数,例如SUBSTRING
答案 1 :(得分:1)
正如the informative answer by George Bahij中所指出的,MySQL缺乏此功能,所以选项可以是使用udfs等扩展功能,也可以使用可用的字符串函数,在这种情况下你可以这样做:
SELECT
SUBSTR(
SUBSTRING_INDEX(
SUBSTRING_INDEX(item,'<title>',2)
,'</title>',1)
FROM 8
)
from table
或者,如果您需要从中提取的字符串始终采用<title>item</title>
格式,那么您可以简单地使用替换:replace(replace(item, '<title>', ''), '</title>','')
答案 2 :(得分:0)
此正则表达式:<\w+>.+</\w+>
将匹配标记中的内容。
您的查询应该是:
SELECT * FROM `table` WHERE `field` REGEXP '<\w+>.+</\w+>';
然后,如果你正在使用PHP或类似的东西,你可以使用像strip_tags这样的函数来提取标签之间的内容。
答案 3 :(得分:0)
不应该用正则表达式解析XML,无论如何,MySQL只支持匹配,而不是替换。
但MySQL支持XPath 1.0。你应该能够做到这一点:
SELECT ExtractValue(item,'/title') AS item_title FROM table;